Tarayıcıda çalışan kodlama algılayıcı; örnek yükleme, dönüşüm ipuçları ve 16 dilde belge sunar.
Features
- Akıllı Algılama: İstatistiksel analiz ve BOM kontrolüyle UTF-8, GBK, Big5, Shift-JIS gibi kodlamaları yüksek doğrulukla tespit eder.
- Kodlama Dönüşümü: Metni hedef kodlamaya dönüştürür, BOM ekleme/çıkarma seçenekleri sunar ve mojibake sorunlarını giderir.
- Sorun Teşhisi: Geçersiz bayt dizilerini, karışık kodlamaları ve BOM uyuşmazlıklarını tespit eder.
- Çoklu Dosya Desteği: Birden fazla dosyayı sırayla işleyerek rapor ve istatistikler oluşturur.
Use Cases
- Legacy sistem göçü: Finans, ERP veya kamu sistemlerini modernize ederken GBK/Big5 arşivlerini topluca UTF-8’e çevirin.
- Küresel içerik QA: İçerik ve SEO ekipleri çok dilli sitelerin, RSS’lerin ve e-postaların doğru charset ile hizmet verdiğini doğrular.
- Veri alma hatları: Ortaklardan gelen log, CSV ve ETL girişlerinin kodlamasını veri ambarına veya Spark’a yüklemeden önce kontrol edin.
- Geliştirici hata ayıklama: Git diff’lerinde veya veritabanı dışa aktarmalarında BOM çakışmalarını ve karışık kodlamaları hızla tespit edin.
Usage Guide
- Metni Yükleyin: Dosyayı yükleyin veya metni yapıştırın.
- Kodlamayı Algılayın: Algıla butonuna basarak otomatik saptama yapın ya da kodlamayı manuel seçin.
- Sonuçları İnceleyin: Algılanan kodlamayı, güven oranını ve BOM durumunu kontrol edin.
- Gerekirse Dönüştürün: Hedef kodlamayı seçip çıktıyı indirin veya kopyalayın.
Technical Details
Kodlama Standartları
ASCII, ISO-8859, GBK, Big5, Shift-JIS ve Unicode (UTF-8/16) gibi standartlar farklı diller için geliştirilmiştir. Günümüzde en yaygın öneri UTF-8'dir.
Algılama Yöntemleri
Araç, BOM imzalarını, karakter frekanslarını ve geçerli bayt aralıklarını analiz ederek kodlama tahmini yapar.
Dönüştürme Süreci
Önce kaynak kodlamadan Unicode'a çözer, ardından hedef kodlamaya yeniden kodlar; eşleşmeyen karakterlerde uyarı verir.
Frequently Asked Questions
- Kodlama algılama ne kadar doğru?
- Algılayıcı, en olası karakter kümesini tahmin etmek için BOM algılama, istatistiksel analiz ve bayt deseni doğrulamayı birleştirir. Her çalıştırma aynı zamanda ek manuel incelemenin ne zaman önerildiğini bilmeniz için bir güven puanı da gösterir.
- Algılamadan sonra metni dönüştürebilir miyim?
- Evet. Bir kodlama tanımlandıktan sonra herhangi bir hedef karakter kümesini seçebilir, metni tamamen tarayıcıda dönüştürebilir ve dosya yüklemeden dönüştürülmüş çıktıyı indirebilir veya kopyalayabilirsiniz.
- BOM Ekle veya Kaldır seçeneği ne yapar?
- BOM (Byte Order Mark), UTF dosyalarının başlangıcında isteğe bağlı bir imzadır. BOM eklemek, bazı Windows araçlarının kodlamayı algılamasına yardımcı olurken, kaldırmak dosyaları UNIX ortamları için yalın tutar. Metnin nerede kullanılacağına göre seçeneği değiştirin.
- Dönüştürmeden sonra neden hala bozuk karakterler görüyorum?
- Metin daha önce yanlış karakter kümesiyle çözülmüşse hasar zaten kaydedilmiş olabilir. Orijinal dosyayı yeniden yüklemeyi deneyin, doğru kaynak kodlamanın seçildiğinden emin olun ve tekrar dönüştürün. Tek bir dosyadaki karışık kodlamalar da mojibake üretebilir.
- Metnimden herhangi biri yükleniyor veya saklanıyor mu?
- Hayır. Algılama ve dönüştürme tamamen tarayıcınızda gerçekleşir. Dosyalar hiçbir zaman cihazınızdan ayrılmaz, bu nedenle gizli belgeler özel kalır.
Related Documentation
- Unicode Standardı - Unicode karakter kodlamasının resmi spesifikasyonu.
- RFC 3629 - UTF-8 - UTF-8 kodlama formatı tanımı.
- GB18030 Çince Kodlaması - Çin ulusal karakter kodlaması hakkında bilgi.
- ICU Kodlama Algılama - Unicode bileşenleri kütüphanesinin algılama rehberi.
- Chardet Projesi - Popüler açık kaynak kodlama algılama kütüphanesi.