🔍

Trình nhận diện định dạng tệp

Phân tích Tiêu đề và nội dung để nhận diện định dạng tệp. Tải lên bất kỳ tệp nào để xác định loại, định dạng và thông tin chi tiết.

Trình nhận diện định dạng tệp

Công cụ sử dụng magic number (chữ ký tệp) để nhận dạng bằng cách đọc những byte đầu tiên. Ví dụ JPEG (FF D8 FF), PNG (89 50 4E 47), PDF (25 50 44 46). Công cụ đối chiếu với cơ sở dữ liệu chữ ký và kiểm tra tính nhất quán, hữu ích trong bảo mật, khôi phục dữ liệu và xác thực tải lên.

Tính năng

🚀

Phân tích magic number

Dò Tiêu đề và chữ ký để xác định định dạng chuẩn xác.

Hỗ trợ hàng trăm định dạng

Thư viện chữ ký phong phú bao phủ nhiều loại tệp phổ biến.
🎯

Hiển thị Tiêu đề dạng hex/ASCII

Quan sát Tiêu đề ở cả hai dạng để kiểm tra chuyên sâu.
🔒

Thông tin chi tiết

Cho biết kích thước, phần mở rộng và loại tệp phát hiện được.

📋Hướng dẫn sử dụng

1️⃣
Chọn tệp cần phân tích
Nhấn "Tải tệp" và chọn Tệp không rõ định dạng hoặc cần xác minh.
2️⃣
Xem phân tích Tiêu đề
Hệ thống đọc magic number và hiển thị Tiêu đề ở dạng Hex/ASCII.
3️⃣
Đọc kết quả
Theo dõi loại tệp, phần mở rộng gợi ý, MIME và gợi ý hành động tiếp theo.
4️⃣
Sao chép thông tin
Sử dụng nút sao chép để lưu Tiêu đề hoặc meta vào báo cáo điều tra.

📚Giới thiệu kỹ thuật

🔍Magic number và chữ ký tệp

Nhận diện dựa trên magic number – chuỗi byte đặc trưng ở đầu tệp. Ví dụ JPEG mở đầu FF D8 FF, PNG 89 50 4E 47, GIF 47 49 46 38, PDF 25 50 44 46, ZIP 50 4B 03 04. Công cụ đọc 512 byte đầu và đối chiếu với cơ sở dữ liệu chữ ký.

⚙️Thuật toán phát hiện

Quy trình gồm đọc nhị phân bằng FileReader (ArrayBuffer), chuyển sang Uint8Array, so khớp chữ ký, và phân tích nội dung dự phòng nếu Tiêu đề không khớp. Tiêu đề hiển thị dưới dạng hex để kiểm tra kỹ thuật.

💡Ứng dụng trong bảo mật và khôi phục

Hữu ích khi phát hiện tệp độc hại ngụy trang, khôi phục tệp mất phần mở rộng, điều tra pháp y, và xác thực tải lên/lọc nội dung.

🗂️Cơ sở dữ liệu chữ ký

Danh mục chữ ký được biên soạn từ nguồn Mở-source (Tệp-Loại, TrID) và cập nhật định kỳ để theo kịp định dạng mới như HEIC, AVIF, DOCX.

Câu hỏi thường gặp

Magic number là gì?

Magic number là chuỗi byte cố định ở đầu tệp dùng để định danh định dạng. Ví dụ PNG bắt đầu bằng 89 50 4E 47, PDF là 25 50 44 46.
💬

Khi nào nên dùng trình nhận diện định dạng?

Khi bạn nhận được tệp không rõ nguồn gốc, khi cần xác thực tệp tải lên, trong điều tra số hoặc khi khôi phục tệp mất phần mở rộng.
🔍

Chỉ dựa vào phần mở rộng có an toàn không?

Không. Phần mở rộng dễ bị thay đổi (ví dụ malware.exe đổi thành invoice.pdf). Luôn kiểm tra magic number và MIME để đảm bảo.
💡

Công cụ có gửi tệp lên máy chủ không?

Không. Việc phân tích diễn ra hoàn toàn trong trình duyệt bằng ArrayBuffer, đảm bảo dữ liệu nhạy cảm không rời khỏi máy của bạn.
📚

Làm sao thêm định dạng mới?

Bạn có thể mở rộng cơ sở dữ liệu chữ ký với cặp {magic bytes, phần mở rộng, MIME}. Các thư viện như magic-bytes.js giúp cập nhật nhanh.

💡Cách sử dụng

💡

Cập nhật cơ sở dữ liệu

Duy trì danh sách magic number mới để nhận diện định dạng vừa xuất hiện.

Không chỉ tin vào phần mở rộng

Luôn kiểm tra magic number (đặc biệt ở phía server) vì phần mở rộng dễ bị đổi tên.

Kết hợp nhiều phương pháp

Dùng phần mở rộng, magic number, MIME và phân tích nội dung để tăng độ tin cậy.
⚠️

Cảnh báo bảo mật

Phát hiện tệp thực thi giả mạo tệp tài liệu, hoặc tên kép như Tệp.pdf.exe.
🛡️

Xử lý cục bộ

Mọi phân tích diễn ra trong trình duyệt, đảm bảo dữ liệu không rời khỏi máy.

User Comments

0 / 2000
Loading...