Phân tích Tiêu đề và nội dung để nhận diện định dạng tệp. Tải lên bất kỳ tệp nào để xác định loại, định dạng và thông tin chi tiết.
Features
- Phân tích magic number: Dò Tiêu đề và chữ ký để xác định định dạng chuẩn xác.
- Hỗ trợ hàng trăm định dạng: Thư viện chữ ký phong phú bao phủ nhiều loại tệp phổ biến.
- Hiển thị Tiêu đề dạng hex/ASCII: Quan sát Tiêu đề ở cả hai dạng để kiểm tra chuyên sâu.
- Thông tin chi tiết: Cho biết kích thước, phần mở rộng và loại tệp phát hiện được.
Usage Guide
- Chọn tệp cần phân tích: Nhấn "Tải tệp" và chọn Tệp không rõ định dạng hoặc cần xác minh.
- Xem phân tích Tiêu đề: Hệ thống đọc magic number và hiển thị Tiêu đề ở dạng Hex/ASCII.
- Đọc kết quả: Theo dõi loại tệp, phần mở rộng gợi ý, MIME và gợi ý hành động tiếp theo.
- Sao chép thông tin: Sử dụng nút sao chép để lưu Tiêu đề hoặc meta vào báo cáo điều tra.
Technical Details
Magic number và chữ ký tệp
Nhận diện dựa trên magic number – chuỗi byte đặc trưng ở đầu tệp. Ví dụ JPEG mở đầu FF D8 FF, PNG 89 50 4E 47, GIF 47 49 46 38, PDF 25 50 44 46, ZIP 50 4B 03 04. Công cụ đọc 512 byte đầu và đối chiếu với cơ sở dữ liệu chữ ký.
Thuật toán phát hiện
Quy trình gồm đọc nhị phân bằng FileReader (ArrayBuffer), chuyển sang Uint8Array, so khớp chữ ký, và phân tích nội dung dự phòng nếu Tiêu đề không khớp. Tiêu đề hiển thị dưới dạng hex để kiểm tra kỹ thuật.
Ứng dụng trong bảo mật và khôi phục
Hữu ích khi phát hiện tệp độc hại ngụy trang, khôi phục tệp mất phần mở rộng, điều tra pháp y, và xác thực tải lên/lọc nội dung.
Frequently Asked Questions
- Magic number là gì?
- Magic number là chuỗi byte cố định ở đầu tệp dùng để định danh định dạng. Ví dụ PNG bắt đầu bằng 89 50 4E 47, PDF là 25 50 44 46.
- Khi nào nên dùng trình nhận diện định dạng?
- Khi bạn nhận được tệp không rõ nguồn gốc, khi cần xác thực tệp tải lên, trong điều tra số hoặc khi khôi phục tệp mất phần mở rộng.
- Chỉ dựa vào phần mở rộng có an toàn không?
- Không. Phần mở rộng dễ bị thay đổi (ví dụ malware.exe đổi thành invoice.pdf). Luôn kiểm tra magic number và MIME để đảm bảo.
- Công cụ có gửi tệp lên máy chủ không?
- Không. Việc phân tích diễn ra hoàn toàn trong trình duyệt bằng ArrayBuffer, đảm bảo dữ liệu nhạy cảm không rời khỏi máy của bạn.
- Làm sao thêm định dạng mới?
- Bạn có thể mở rộng cơ sở dữ liệu chữ ký với cặp {magic bytes, phần mở rộng, MIME}. Các thư viện như magic-bytes.js giúp cập nhật nhanh.
Related Documentation
- Cơ sở dữ liệu chữ ký tệp - Danh sách magic number và mô tả định dạng phục vụ đối chiếu nhanh khi nhận diện.
- RFC 6838 - Media Loại - Đặc tả IETF về quy tắc đặt tên Media Loại và đăng ký MIME chính thức.
- MDN - API FileReader - Hướng dẫn sử dụng FileReader và ArrayBuffer để đọc nhị phân trên trình duyệt.
- Wikipedia - Chữ ký tệp - Tổng hợp magic number của nhiều định dạng, nguồn tham khảo phổ biến cho kiểm tra định dạng.
- TrID - Bộ nhận diện định dạng - Công cụ nhận diện định dạng bằng pattern matching, cung cấp thêm cơ sở dữ liệu magic number.