Share
https://www.online-toolz.com/tools/text-unicode-entities-convertor.php
O Unicode é um padrão da indústria de computação para a codificação, representação e tratamento consistentes de texto expresso na maioria dos sistemas de escrita do mundo. Desenvolvida em conjunto com o padrão Universal Character Set e publicada em forma de livro como The Unicode Standard, a versão mais recente do Unicode consiste em um repertório de mais de 109.000 caracteres abrangendo 93 scripts, um conjunto de gráficos de código para referência visual, uma metodologia de codificação e um conjunto de padrões codificações de caracteres, uma enumeração de propriedades de caracteres, como maiúsculas e minúsculas, um conjunto de dados de referência, arquivos de computador e vários itens relacionados, como propriedades de caracteres, regras para normalização, decomposição, agrupamento, renderização e ordem de exibição bidirecional (para a exibição correta de texto contendo scripts da direita para a esquerda, como árabe e hebraico, e scripts da esquerda para a direita). Em 2011, a revisão principal mais recente do Unicode é o Unicode 6.0. O Unicode Consortium, a organização sem fins lucrativos que coordena o desenvolvimento do Unicode, tem o objetivo ambicioso de eventualmente substituir os esquemas de codificação de caracteres existentes pelo Unicode e seus esquemas padrão de Formato de Transformação Unicode (UTF), já que muitos dos esquemas existentes são limitados em tamanho e escopo e são incompatíveis com ambientes multilíngues. O sucesso do Unicode na unificação de conjuntos de caracteres levou ao seu uso generalizado e predominante na internacionalização e localização de software de computador. O padrão foi implementado em muitas tecnologias recentes, incluindo XML, a linguagem de programação Java, o Microsoft .NET Framework e sistemas operacionais modernos. O Unicode pode ser implementado por diferentes codificações de caracteres. As codificações mais usadas são UTF-8 (que usa um byte para qualquer caractere ASCII, que tem os mesmos valores de código na codificação UTF-8 e ASCII e até quatro bytes para outros caracteres), o agora obsoleto UCS-2 (que usa dois bytes para cada caractere, mas não pode codificar todos os caracteres no atual Padrão Unicode) e UTF-16 (que estende o UCS-2 para lidar com pontos de código além do escopo do UCS-2).
Source:
Wikipedia
AKA:
Palavras-chave: texto, HTML, entidades, conversor, codificação, caracteres, escape, decodificação, unescape, unicode, utf8, ascii
|