🥳Hãy tham gia Cộng đồng ScrapelessYêu cầu dùng thử miễn phí để truy cập Bộ công cụ quét web mạnh mẽ của chúng tôi!
Quay lại Blog

Font Fingerprinting là gì?

Emily Chen
Emily Chen

Advanced Data Extraction Specialist

14-Nov-2024

In dấu vân tay phông chữ là gì và cách hoạt động?

In dấu vân tay phông chữ là một kỹ thuật tiên tiến được sử dụng để theo dõi trực tuyến, tận dụng bộ phông chữ độc đáo được cài đặt trên thiết bị của người dùng. Đây là một loại in dấu vân tay thiết bị, tương tự như in dấu vân tay WebGL hoặc Canvas, nhưng thay vì dựa vào việc hiển thị đồ họa hoặc các yếu tố web, in dấu vân tay phông chữ tập trung vào các phông chữ có sẵn và cách chúng được hiển thị bởi trình duyệt. Kỹ thuật này được các trang web sử dụng để thu thập thông tin về thiết bị, và do đó là người dùng, mà không yêu cầu sự đồng ý rõ ràng hoặc sử dụng các phương pháp theo dõi truyền thống như cookie.

Trong bài viết này, chúng ta sẽ khám phá in dấu vân tay phông chữ là gì, cách hoạt động, ứng dụng và các rủi ro tiềm ẩn về quyền riêng tư liên quan đến nó. Chúng ta cũng sẽ thảo luận về cách ngăn chặn rò rỉ dấu vân tay phông chữ và cách các công cụ web scraper có thể quản lý cài đặt phông chữ để tránh bị phát hiện.

In dấu vân tay phông chữ hoạt động như thế nào?

In dấu vân tay phông chữ hoạt động bằng cách tận dụng thực tế là mỗi thiết bị đều có một tổ hợp phông chữ được cài đặt độc đáo. Các phông chữ này được hệ điều hành và trình duyệt sử dụng để hiển thị văn bản trên các trang web. Tuy nhiên, không phải tất cả các thiết bị đều có cùng phông chữ được cài đặt. Hệ điều hành, tùy chọn khu vực và thậm chí cả sở thích của người dùng đều góp phần vào sự khác biệt trong phông chữ. Các trang web có thể phát hiện sự khác biệt này bằng cách truy vấn trình duyệt và so sánh các phông chữ được sử dụng trên một trang web.

Dưới đây là cách phân tích từng bước về cách in dấu vân tay phông chữ hoạt động:

  1. Phát hiện phông chữ: Khi người dùng truy cập một trang web, JavaScript được nhúng trên trang sẽ chạy một kịch bản kiểm tra xem phông chữ nào có sẵn trên thiết bị của người dùng. Trang web thường sẽ tạo một yếu tố ẩn (như một div hoặc canvas) và cố gắng hiển thị văn bản bằng các phông chữ khác nhau. Nó sẽ kiểm tra xem liệu các phông chữ cụ thể có được cài đặt hay không bằng cách so sánh chiều rộng và kiểu hiển thị của văn bản.

  2. Thu thập dữ liệu: Kịch bản sẽ kiểm tra các phông chữ phổ biến (như Arial, Times New Roman hoặc Courier) và cả các phông chữ ít được sử dụng hơn. Nó có thể cố gắng phát hiện các phông chữ khó hiểu hơn được cài đặt dựa trên các hệ điều hành hoặc cài đặt ngôn ngữ khu vực cụ thể. Trang web có thể sử dụng những kết quả này để tạo một hồ sơ về thiết bị của người dùng.

  3. Tạo dấu vân tay: Dựa trên các phông chữ được phát hiện, một trình định danh duy nhất hoặc "dấu vân tay" được tạo ra. Trình định danh này có thể tồn tại lâu dài và được sử dụng để theo dõi người dùng qua nhiều lượt truy cập và trang web. Dấu vân tay thường là sự kết hợp của các yếu tố, chẳng hạn như các phông chữ được phát hiện và cách văn bản được hiển thị.

  4. Theo dõi người dùng: Sau khi dấu vân tay được tạo, nó có thể được lưu trữ trong cơ sở dữ liệu hoặc cookie và được sử dụng để theo dõi người dùng theo thời gian. Ngay cả khi người dùng xóa cookie hoặc chuyển trình duyệt, dấu vân tay phông chữ của họ vẫn có thể được xác định, cho phép các trang web tiếp tục theo dõi hoạt động của họ.

Ứng dụng của in dấu vân tay phông chữ

In dấu vân tay phông chữ có nhiều ứng dụng, cả cho mục đích hợp pháp và các hoạt động tiềm ẩn xâm phạm quyền riêng tư như theo dõi người dùng. Dưới đây là một số lĩnh vực chính nơi in dấu vân tay phông chữ được sử dụng:

Ứng dụng Mô tả Ví dụ trường hợp sử dụng
Nhắm mục tiêu quảng cáo In dấu vân tay phông chữ giúp các nhà quảng cáo tạo hồ sơ người dùng chi tiết hơn để nhắm mục tiêu quảng cáo. Các nhà quảng cáo theo dõi người dùng trên các trang web khác nhau để phục vụ quảng cáo cá nhân hóa dựa trên dấu vân tay phông chữ của họ.
Phân tích Được sử dụng bởi chủ sở hữu trang web để phân tích lưu lượng truy cập và cải thiện trải nghiệm người dùng bằng cách hiểu các đặc điểm của thiết bị. Chủ sở hữu trang web theo dõi người dùng dựa trên dấu vân tay phông chữ của thiết bị để nhắm mục tiêu tốt hơn và tối ưu hóa trải nghiệm người dùng.
Theo dõi chéo trang web Theo dõi người dùng trên các trang web khác nhau bằng cách thu thập dữ liệu phông chữ và liên kết nó với một trình định danh duy nhất. Các nhà môi giới dữ liệu và nhà quảng cáo theo dõi hoạt động của người dùng trên các trang web mà không cần cookie, bằng cách sử dụng dấu vân tay phông chữ.
Phòng chống gian lận Xác định các hoạt động đáng ngờ bằng cách so sánh các đặc điểm của thiết bị và gắn cờ các bất thường. Các hệ thống ngân hàng trực tuyến phát hiện các hoạt động gian lận dựa trên dấu vân tay phông chữ bất thường liên kết với các tác nhân độc hại.
Hồ sơ thiết bị Giúp xác định người dùng bằng cách lập hồ sơ cấu hình phần cứng và phần mềm của họ dựa trên các phông chữ được cài đặt. Các công ty sử dụng dấu vân tay phông chữ để theo dõi các thiết bị được khách hàng sử dụng cho các chiến dịch nhắm mục tiêu hoặc phòng chống gian lận.
Phân tích hành vi người dùng Hiểu hành vi của người dùng bằng cách phân tích các tính năng của thiết bị và phông chữ. Các nhà phát triển web theo dõi sở thích của người dùng để cá nhân hóa nội dung tốt hơn dựa trên dấu vân tay phông chữ của họ.

Các kỹ thuật in dấu vân tay phông chữ

In dấu vân tay phông chữ là một kỹ thuật được các trang web sử dụng để thu thập thông tin về các phông chữ được cài đặt trên thiết bị của bạn. Quá trình này liên quan đến việc thực thi các kịch bản trong nền để thu thập dữ liệu về phông chữ mà trình duyệt có thể hiển thị. Hãy đi sâu hơn vào các phương pháp cụ thể mà các trang web sử dụng để in dấu vân tay phông chữ.

1. Liệt kê phông chữ

Liệt kê phông chữ là một trong những phương pháp đơn giản nhất và được sử dụng phổ biến nhất của in dấu vân tay phông chữ. Kỹ thuật này liên quan đến việc sử dụng JavaScript để kiểm tra xem phông chữ nào có sẵn trên hệ thống của người dùng.

Cách hoạt động của nó như sau:

  • Khi người dùng truy cập một trang web, mã của trang web sẽ chạy trong trình duyệt và kích hoạt quá trình liệt kê phông chữ. Điều này thường được thực hiện bằng cách gọi các hàm JavaScript truy cập giao diện FontFaceSet hoặc các phương thức tương tự có sẵn trong các trình duyệt hiện đại.

  • Sau khi được khởi tạo, trình duyệt sẽ phản hồi bằng cách cung cấp một danh sách các phông chữ mà nó có thể hiển thị. Thông tin này rất quan trọng để tạo dấu vân tay.

  • Trang web sẽ thu thập và xử lý dữ liệu phông chữ, thường kết hợp nó với các kỹ thuật in dấu vân tay khác như in dấu vân tay canvas hoặc in dấu vân tay TLS. Các loại dữ liệu được thu thập có thể bao gồm:

    • Họ phông chữ, chẳng hạn như "Helvetica"
    • Tên phông chữ, như "Helvetica Oblique"
    • Tên PostScript, ví dụ, "HelveticaOblique"
    • Kiểu, chẳng hạn như "Regular"
    • Kích thước phông chữ
  • Sau khi thu thập dữ liệu này, trang web sẽ phân tích nó để tạo một dấu vân tay duy nhất. Dấu vân tay này có thể dựa trên tổ hợp cụ thể của các phông chữ được cài đặt trên hệ thống, thứ tự của chúng, và đôi khi là cách phông chữ được hiển thị một cách tinh tế.

Tìm hiểu thêm về FontFaceSet để hiểu các API cơ bản liên quan.

2. Phát hiện phông chữ

Phát hiện phông chữ là một kỹ thuật nâng cao hơn được sử dụng trong in dấu vân tay phông chữ. Không giống như liệt kê phông chữ, trực tiếp yêu cầu trình duyệt một danh sách các phông chữ đã cài đặt, phát hiện phông chữ kiểm tra xem liệu các phông chữ cụ thể có được cài đặt bằng cách hiển thị văn bản với các phông chữ khác nhau.

Cách hoạt động của nó như sau:

  • Trang web sẽ kích hoạt phát hiện phông chữ bằng cách hướng dẫn trình duyệt hiển thị một đoạn văn bản bằng một phông chữ cụ thể.

  • Sau khi văn bản được hiển thị, trang web sẽ đo kích thước của văn bản, tính toán cả chiều rộng và chiều cao của phần tử văn bản.

  • Kích thước văn bản được hiển thị sau đó được so sánh với kích thước tham chiếu. Nếu kích thước khớp, điều đó cho thấy rằng phông chữ đã được cài đặt trên hệ thống của người dùng.

  • Phương pháp này có thể liên quan đến việc kiểm tra nhiều phông chữ khác nhau hoặc các phiên bản khác nhau của cùng một phông chữ, cung cấp dữ liệu có giá trị về các phông chữ có trên hệ thống.

Phát hiện phông chữ thường được sử dụng kết hợp với các kỹ thuật in dấu vân tay khác để thu thập thông tin toàn diện hơn về hệ thống của người dùng.

3. In dấu vân tay phông chữ Canvas

In dấu vân tay phông chữ Canvas là một kỹ thuật tinh vi hơn và là một trong những phương pháp được sử dụng rộng rãi nhất để theo dõi người dùng trực tuyến. Phương pháp này tạo ra một trình định danh cực kỳ duy nhất dựa trên cách phông chữ được hiển thị trong một phần tử canvas HTML ẩn.

Cách hoạt động của nó như sau:

  • Trang web sẽ hướng dẫn trình duyệt vẽ văn bản lên một phần tử canvas ẩn bằng một phông chữ cụ thể. Điều này được thực hiện trong nền và không ảnh hưởng đến những gì người dùng nhìn thấy.

  • Sau khi văn bản được hiển thị, trang web sẽ trích xuất dữ liệu pixel từ canvas, đại diện cho cách văn bản trông trên màn hình.

  • Dữ liệu pixel sau đó được băm bằng một thuật toán như SHA-256, tạo ra một dấu vân tay duy nhất cho việc hiển thị phông chữ đó.

  • Dấu vân tay này được sử dụng để theo dõi và xác định người dùng trên các phiên và trang web khác nhau. Băm được tạo ra đóng vai trò là một trình định danh duy nhất, ngay cả khi người dùng xóa cookie của họ.

Văn bản được sử dụng để hiển thị thường bao gồm tất cả các chữ cái trong bảng chữ cái, được gọi là pangram. Ví dụ, câu "Cwm fjordbank glyphs vext quiz" bao gồm tất cả các chữ cái trong bảng chữ cái. Tuy nhiên, văn bản chính xác có thể thay đổi tùy thuộc vào các kịch bản của trang web.

Khám phá cách in dấu vân tay canvas hoạt động để tìm hiểu về việc sử dụng rộng rãi và tác động của nó trong việc theo dõi.

In dấu vân tay phông chữ Canvas đặc biệt hiệu quả bởi vì hành vi hiển thị thay đổi dựa trên các yếu tố như hệ điều hành, trình duyệt và phần cứng đồ họa của người dùng, khiến việc chặn hoặc giả mạo nó cực kỳ khó khăn.

Tóm tắt các phương pháp in dấu vân tay phông chữ

Kỹ thuật Mô tả Mục đích
Liệt kê phông chữ Trực tiếp truy vấn trình duyệt để có danh sách các phông chữ đã cài đặt bằng cách sử dụng JavaScript. Để thu thập một bộ phông chữ duy nhất có sẵn trên thiết bị của người dùng.
Phát hiện phông chữ Hiển thị văn bản với một phông chữ cụ thể và đo kích thước của văn bản được hiển thị để kiểm tra xem liệu phông chữ đã được cài đặt. Để phát hiện phông chữ gián tiếp bằng cách kiểm tra cách chúng hiển thị văn bản.
In dấu vân tay phông chữ Canvas Sử dụng các phần tử canvas ẩn để hiển thị văn bản và băm dữ liệu pixel thành một trình định danh duy nhất. Để tạo một dấu vân tay cực kỳ duy nhất dựa trên việc hiển thị phông chữ.

Các rủi ro về bảo mật của in dấu vân tay phông chữ

In dấu vân tay phông chữ đặt ra những lo ngại đáng kể về quyền riêng tư và bảo mật. Một số rủi ro bao gồm:

  1. Theo dõi dai dẳng: Dấu vân tay phông chữ, không giống như cookie, không dễ xóa. Khi dấu vân tay được tạo, nó có thể được sử dụng để theo dõi người dùng trên nhiều phiên và trang web, ngay cả khi họ xóa cookie hoặc sử dụng chế độ ẩn danh. Điều này khiến người dùng khó duy trì ẩn danh trực tuyến.

  2. Theo dõi chéo trang web: Vì in dấu vân tay phông chữ hoạt động trên các trang web khác nhau, nó có thể tạo ra hồ sơ chi tiết và toàn diện hơn về người dùng. Các nhà môi giới dữ liệu và nhà quảng cáo có thể kết hợp in dấu vân tay phông chữ với các phương pháp theo dõi khác để giám sát hoạt động trực tuyến của người dùng trên nhiều miền.

  3. Hồ sơ thiết bị: Dấu vân tay phông chữ có thể tiết lộ thông tin cụ thể về thiết bị của người dùng, bao gồm hệ điều hành, cài đặt ngôn ngữ và các phông chữ được cài đặt. Thông tin này có thể được sử dụng để lập hồ sơ người dùng cho quảng cáo nhắm mục tiêu, và có khả năng bị khai thác cho các mục đích độc hại, chẳng hạn như lừa đảo hoặc tấn công mạng nhắm mục tiêu.

  4. Né tránh các công cụ bảo vệ quyền riêng tư: In dấu vân tay phông chữ có thể bỏ qua các công cụ bảo vệ quyền riêng tư như VPN, trình chặn cookie và chế độ ẩn danh, vì nó dựa trên dữ liệu cụ thể của thiết bị không bị ảnh hưởng bởi các công cụ này. Ngay cả khi người dùng đang thực hiện các bước để bảo vệ quyền riêng tư của họ, in dấu vân tay phông chữ vẫn có thể theo dõi họ.

  5. Các vấn đề về tuân thủ: Ở các khu vực có quy định về quyền riêng tư nghiêm ngặt (ví dụ: GDPR của Liên minh Châu Âu), in dấu vân tay phông chữ có thể vi phạm các yêu cầu về sự đồng ý của người dùng. Người dùng có thể không biết rằng thiết bị của họ đang bị in dấu vân tay, khiến các tổ chức khó tuân thủ luật bảo vệ dữ liệu.

Cách ngăn chặn rò rỉ dấu vân tay phông chữ

Dưới đây là một số cách để giảm thiểu các rủi ro của in dấu vân tay phông chữ:

1. Vô hiệu hóa hoặc ngẫu nhiên hóa phông chữ

Một số trình duyệt cho phép người dùng vô hiệu hóa một số kịch bản in dấu vân tay phông chữ hoặc ngẫu nhiên hóa các phông chữ mà các trang web có thể truy cập. Điều này làm giảm khả năng tạo một dấu vân tay phông chữ duy nhất.

2. Sử dụng các trình duyệt tập trung vào quyền riêng tư

Các trình duyệt như TorBrave cung cấp các tính năng bảo vệ quyền riêng tư giúp chặn hoặc ngẫu nhiên hóa các nỗ lực in dấu vân tay phông chữ. Các trình duyệt này thường chặn các kịch bản theo dõi của bên thứ ba, bao gồm in dấu vân tay phông chữ, đảm bảo người dùng vẫn ẩn danh.

3. Sử dụng tiện ích mở rộng trình duyệt

Có sẵn một số tiện ích mở rộng giúp chặn hoặc giả mạo các nỗ lực in dấu vân tay phông chữ. Các tiện ích mở rộng như Privacy Badger hoặc CanvasBlocker có thể ngăn chặn các kịch bản phát hiện chi tiết phông chữ và giúp giảm thiểu việc theo dõi.

4. Giả mạo dấu vân tay phông chữ

Cũng giống như với các loại in dấu vân tay khác, việc giả mạo hoặc ngẫu nhiên hóa dấu vân tay phông chữ có thể là một cách hiệu quả để bảo vệ quyền riêng tư. Một số tiện ích mở rộng trình duyệt hoặc công cụ bảo vệ quyền riêng tư cung cấp các tính năng giả mạo phông chữ, khiến các trang web khó phát hiện xem phông chữ nào được cài đặt trên thiết bị của bạn.

5. Giám sát và quản lý cài đặt phông chữ trong web scraping

Đối với các công cụ web scraper, việc quản lý cài đặt phông chữ trở nên rất quan trọng để tránh bị phát hiện. Nhiều trang web sử dụng in dấu vân tay phông chữ để phát hiện bot, vì vậy các công cụ scraping nên cấu hình trình duyệt để ngẫu nhiên hóa hoặc bắt chước cài đặt của người dùng thực. Các công cụ như Scrapeless cung cấp công nghệ trình duyệt không đầu có thể tự động điều chỉnh cài đặt trình duyệt, bao gồm cả phông chữ, để đảm bảo quá trình scraping không bị phát hiện.

Kết luận

In dấu vân tay phông chữ là một kỹ thuật mạnh mẽ để theo dõi người dùng trực tuyến bằng cách sử dụng các phông chữ độc đáo được cài đặt trên thiết bị của họ. Mặc dù nó có thể được sử dụng cho các mục đích hợp pháp, chẳng hạn như nhắm mục tiêu quảng cáo và phân tích, nhưng nó đặt ra những lo ngại đáng kể về quyền riêng tư. Người dùng có thể giảm thiểu các rủi ro của in dấu vân tay phông chữ bằng cách sử dụng các trình duyệt tập trung vào quyền riêng tư, giả mạo dấu vân tay phông chữ và sử dụng các công cụ như Scrapeless để quản lý cài đặt trình duyệt.

Khi các lo ngại về quyền riêng tư tiếp tục gia tăng, điều cần thiết là người dùng và nhà phát triển phải nhận thức được các rủi ro liên quan đến in dấu vân tay phông chữ và thực hiện các biện pháp chủ động để bảo vệ danh tính trực tuyến của họ.

Tại Scrapeless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định hiện hành và chính sách bảo mật của trang web. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm pháp lý đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động thu thập dữ liệu nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem lại các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục