Share

https://www.online-toolz.com/tools/text-unicode-entities-convertor.php

Facebook Share Twitter Share

Decode/Mã hóa văn bản Unicode

Mã hóa/thoát văn bản Unicode

Ví dụ: عربى đến %u 0639% u 0631% u 0628% u0649 Ghi chú:Số thực thể Unicode nằm trong Hex

Văn bản Unicode

Thực thể Unicode

Giải phẩm/Unescape Unicode thực thể

Example: %u0639%u0631%u0628%u0649 to عربى

Note :Unicode Entity numbers are in Hex

Thực thể Unicode

Kết quả


Unicode là một tiêu chuẩn ngành công nghiệp điện toán cho việc mã hóa, biểu diễn và xử lý văn bản nhất quán được thể hiện trong hầu hết các hệ thống viết trên thế giới. Được phát triển kết hợp với tiêu chuẩn Universal Character Set và được xuất bản dưới dạng sách dưới dạng The Unicode Standard, phiên bản mới nhất của Unicode bao gồm một tiết mục hơn 109.000 ký tự bao gồm 93 tập lệnh, một tập hợp các biểu đồ mã để tham khảo trực quan, một phương pháp mã hóa và bộ tiêu chuẩn mã hóa ký tự, một liệt kê các thuộc tính ký tự như chữ hoa và chữ thường, một tập hợp các tập tin máy tính dữ liệu tham chiếu, và một số mục liên quan, chẳng hạn như thuộc tính ký tự, quy tắc cho bình thường hóa, phân hủy, đối chiếu, kết xuất và thứ tự hiển thị hai chiều (để hiển thị chính xác của văn bản chứa cả kịch bản từ phải sang trái, chẳng hạn như tiếng Ả Rập và tiếng Do Thái, và các kịch bản từ trái sang phải). Tính đến năm 2011, phiên bản chính gần đây nhất của Unicode là Unicode 6.0. Unicode Consortium, tổ chức phi lợi nhuận phối hợp sự phát triển của Unicode, có mục tiêu đầy tham vọng là cuối cùng thay thế các lược đồ mã hóa ký tự hiện có bằng Unicode và các lược đồ định dạng chuyển đổi Unicode (UTF) tiêu chuẩn của nó, vì nhiều chương trình hiện có bị giới hạn về kích thước và phạm vi và không tương thích với môi trường đa ngôn ngữ. Thành công của Unicode trong việc thống nhất các bộ ký tự đã dẫn đến việc sử dụng rộng rãi và chiếm ưu thế của nó trong việc quốc tế hóa và nội địa hóa phần mềm máy tính. Tiêu chuẩn đã được triển khai trong nhiều công nghệ gần đây, bao gồm XML, ngôn ngữ lập trình Java, Microsoft .NET Framework, và các hệ điều hành hiện đại. Unicode có thể được thực hiện bằng các mã hóa ký tự khác nhau. Các mã hóa được sử dụng phổ biến nhất là UTF-8 (sử dụng một byte cho bất kỳ ký tự ASCII nào, có cùng giá trị mã trong cả mã hóa UTF-8 và ASCII, và tối đa bốn byte cho các ký tự khác), UCS-2 hiện đã lỗi thời (sử dụng hai byte cho mỗi ký tự nhưng không thể mã hóa mọi ký tự trong hiện tại Chuẩn Unicode), và UTF-16 (mở rộng UCS-2 để xử lý các điểm mã vượt ra ngoài phạm vi của UCS-2).

Source: Wikipedia
AKA:

Từ khóa: Văn bản, HTML, thực thể, bộ chuyển đổi, mã hóa, ký tự, thoát, giải mã, unescape, unicode, utf8, ascii