透過分析檔案標頭和內容來識別檔案格式。上傳任何檔案以識別其格式、類型和詳細資訊。
工具功能
- 透過分析檔案標頭和魔術數字來識別檔案格式。: 讀取檔案起始位元組(魔數),對照簽章資料庫並驗證一致性,準確識別實際格式。
- 支援數百種不同的檔案格式和類型。: 涵蓋影像、視訊、音訊、文件、壓縮檔與可執行檔,簽章庫持續更新。
- 以十六進位和ASCII格式顯示檔案標頭。: 提供十六進位/ASCII 雙視圖,便於技術檢查、除錯與鑑識驗證。
- 提供詳細的檔案資訊,包括大小和副檔名。: 顯示檔名、大小、副檔名、檢測到的格式與 MIME 類型,並提示副檔名與簽章不一致。
使用方法
- 第一步: 點擊「載入檔案」從您的電腦選擇任何檔案。
- 第二步: 工具將分析檔案標頭和內容以確定格式。
- 第三步: 查看有關檔案格式、類型和屬性的詳細資訊。
生成原理
魔數和檔案簽章
檔案格式檢測依賴於魔數(檔案簽章)——檔案開頭的唯一位元組序列用於識別其類型。每種檔案格式都有特定的魔數:JPEG以FF D8 FF開頭、PNG以89 50 4E 47(\x89PNG)開頭、GIF以47 49 46 38(GIF8)開頭、PDF以25 50 44 46(%PDF)開頭、ZIP以50 4B 03 04(PK\x03\x04)開頭。該工具讀取檔案的前512位元組並將模式與綜合魔數資料庫匹配。進階檢測分析:檔案副檔名一致性、多簽章格式以及嵌入檔案檢測。魔數資料庫包括:MIME類型、檔案類別(影像、視訊、音訊、文件、檔案、可執行檔)以及詳細格式版本。
檢測演算法和標頭分析
檢測過程使用多階段分析:二進位檔案讀取、位元組陣列轉換、簽章匹配以及回退檢測。標頭分析包括:十六進位表示、ASCII解釋、位元組序檢測以及結構驗證。進階功能實作:部分檔案讀取、串流檢測、信賴度評分以及副檔名驗證。該工具處理邊緣情況:空檔案、截斷檔案、格式變體以及加密/壓縮容器。
安全和資料復原中的應用
檔案格式檢測在關鍵角色中服務:安全分析、資料復原、取證調查以及內容過濾。該工具幫助開發者、安全研究人員、系統管理員以及資料復原專家。常見用例包括:檢測雙副檔名、識別多格式檔案、驗證下載完整性以及逆向工程未知格式。最佳實踐:永遠不要單獨信任副檔名、在伺服器端驗證魔數、維護更新的簽章資料庫以及結合多種檢測方法。
常見問題
- 我的檔案會被上傳到伺服器嗎?
- 不會。所有檢測均在瀏覽器本地完成,檔案不會被上傳。
- 為什麼檢測到的格式與副檔名不同?
- 副檔名可以被隨意重新命名。檢測更信任內容的魔數簽章,而非副檔名。
- 多格式(Polyglot)檔案能準確識別嗎?
- 多格式檔案可能匹配多個簽章。我們給出置信度最高的結果,如有疑慮請結合標頭細節判斷。
- 什麼是魔數(檔案簽章)?
- 位於檔案開頭的特徵位元組序列,用於標識格式,如 JPEG 的 FF D8 FF、PNG 的 89 50 4E 47。
- 可用於正式環境的安全校驗嗎?
- 可以,但應搭配伺服器端校驗,並結合 MIME 與內容掃描等多重檢查。
相關文件
- 檔案簽章資料庫 - 魔數大全 - 全面的檔案簽章和魔數資料庫,用於格式識別
- RFC 6838 - 媒體類型規範 - IETF 媒體類型和 MIME 類型註冊規範
- MDN - FileReader API - 瀏覽器中讀取檔案內容和二進位資料的 Web API
- Wikipedia - 檔案簽章列表 - 各種檔案格式的簽章和魔數詳細列表
- TrID - 檔案識別工具 - 使用模式匹配進行格式檢測的免費檔案識別工具