Báo cáo thời gian thực về số ký tự, từ, câu, đoạn, thời gian đọc/nói, bảng tần suất và chỉ số đọc hiểu giúp biên tập nhanh và chính xác.
Features
- Thống kê toàn diện: Đếm ký tự (có/không khoảng trắng), từ, câu, đoạn, từ duy nhất và độ dài trung bình.
- Ước tính thời gian đọc: Tính thời gian đọc, đọc thành tiếng dựa trên tốc độ 200/150 từ mỗi phút.
- Tần suất & Dừng word: Liệt kê top 10 từ/ký tự, loại bỏ Dừng word phổ biến để phản ánh nội dung cốt lõi.
- Phân tích độ phức tạp: Đánh giá độ dễ đọc, số từ/câu trung bình và gợi ý tối ưu nội dung.
Usage Guide
- Bước 1: Nhập văn bản: Dán hoặc tải văn bản cần phân tích vào ô nhập liệu.
- Bước 2: Phân tích: Nhấp "Phân tích" để công cụ chạy thống kê, hiển thị tiến trình thời gian thực.
- Bước 3: Đọc báo cáo: Xem số liệu cơ bản, thời gian đọc, tần suất từ/ký tự và đánh giá độ phức tạp.
- Bước 4: Sao chép hoặc tải: Sao chép thống kê hoặc tải kết quả để đưa vào báo cáo, CMS hay tài liệu nội bộ.
Technical Details
Thống kê văn bản là gì
Thống kê văn bản là quá trình đo lường đặc trưng của nội dung như số ký tự, từ, câu, đoạn và độ dài trung bình nhằm hiểu cấu trúc và độ phức tạp của văn bản.
Thuật toán đếm chính xác
Công cụ sử dụng regex chuẩn Unicode để tách từ, phát hiện câu qua dấu kết thúc (.!?), nhận diện đoạn bằng dòng trống kép và hỗ trợ xử lý đa ngôn ngữ.
Ước tính thời gian
Thời gian đọc được tính từ tốc độ trung bình 200 từ/phút, đọc thành tiếng 150 từ/phút; người dùng có thể so sánh với yêu cầu nội dung thực tế.
Frequently Asked Questions
- Công cụ phân tích cung cấp những thống kê nào?
- Bạn nhận được số lượng ký tự và từ (có và không có khoảng trắng), tổng số dòng, câu và đoạn văn, số lượng từ duy nhất, độ dài trung bình của từ và câu, cộng với bảng tần suất cho các từ và ký tự phổ biến nhất.
- Thời gian đọc và nói được ước tính như thế nào?
- Thời gian đọc giả định khoảng 200 từ mỗi phút và thời gian nói 150 từ mỗi phút, đó là mức trung bình của ngành. Điều chỉnh số cuối cùng nếu khán giả của bạn đọc nhanh hơn hoặc chậm hơn.
- Công cụ có hỗ trợ văn bản đa ngôn ngữ không?
- Có. Tokenizer nhận biết Unicode nên bạn có thể kết hợp Latin, CJK, emoji hoặc script RTL. Chỉ lưu ý rằng các ngôn ngữ không có khoảng trắng rõ ràng có thể yêu cầu xem xét thủ công về số lượng từ.
- Tôi có thể xuất hoặc tái sử dụng thống kê không?
- Bạn có thể sao chép bất kỳ giá trị thẻ nào hoặc toàn bộ bảng kết quả. Nhiều người dùng giữ cửa sổ mở bên cạnh trình soạn thảo của họ để làm mới phân tích khi họ viết.
- Văn bản của tôi có được lưu trữ ở đâu không?
- Không. Phân tích chạy trong trình duyệt của bạn và xóa trang sẽ xóa dữ liệu ngay lập tức.
Related Documentation
- MDN - String Methods - Các phương thức xử lý chuỗi trong JavaScript
- Tiêu chuẩn Unicode - Chuẩn mã hóa ký tự Unicode
- MDN - Regular Expressions - Regex dùng cho xử lý văn bản
- W3C - Character Model - Mô hình ký tự cho web
- MDN - Intl API - API quốc tế hóa phục vụ định dạng văn bản