312 Shares 1535 views

O ASCII, caracteres: Descrição, mesa de códigos e tipos

Como é sabido, o computador armazena informações em forma binária, apresentando-a como uma sequência de zeros e uns. Para traduzir a informação numa forma adequada para consumo humano, cada sequência única de números ao exibir substituído pelo carácter correspondente.

Um dos sistemas de correlação códigos binários para imprimir e caracteres de controle é ASCII.

No nível atual de desenvolvimento da tecnologia de computador o usuário não precisa saber o código para cada símbolo particular. No entanto, a compreensão geral de como a codificação é realizada, é extremamente útil, e para algumas categorias de especialistas e todos necessário.

Criar ASCII

Na forma original do código foi desenvolvido em 1963 e, em seguida, por 25 anos duas vezes actualizado.

Na versão original da tabela de caracteres ASCII inclui 128 caracteres, versão mais tarde apareceu estendida, onde os primeiros 128 caracteres são salvas e códigos envolvidos com os símbolos oitavo bit mapeados anteriormente ausentes.

Ao longo dos anos, essa codificação é o mais popular no mundo. Em 2006 o lugar de liderança tomou Latina em 1252, e no final de 2007 e atualmente ocupa uma posição de liderança firmemente Unicode.

representação ASCII computador

Cada ASCII caracteres tem seu próprio código que consiste de 8 caracteres, representando um zero ou um. O número mínimo de tal representação é zero (oito zeros no sistema binário), que é a fonte do primeiro elemento da tabela.

código binário máximo para uma versão ASCII do original é nulos + sete unidades, e na versão estendida – oito unidades, ligadas como o oitavo bit.

caracteres de controle

caracteres de controle são chamados de sinais que não têm uma representação gráfica e é utilizado para a organização do texto, gerenciamento de dispositivos, etc. Eles podem indicar o início ou no final do texto, guias, gerando um sinal de som, várias operações para TTY (teletipo – .. Máquina para transmissão de dados canal eléctrico) resolução dos dados do dispositivo de saída, etc acção cancelamento.

Na tabela de caracteres ASCII posições 0 a 31, e 127 são alocados para caracteres de controle. Total de 33 marcas.

Os restantes caracteres

Os 95 posições restantes são reservados para sinais de pontuação e operações matemáticas, dígitos decimais, letras do alfabeto, diferente registo: "A" e um "A" maiúsculo correspondem horizontal para códigos diferentes na tabela de caracteres ASCII.

números de caracteres na tabela

Se uma pessoa está envolvida no desenvolvimento de software, ou para executar algumas outras tarefas a partir do campo da tecnologia da informação, é necessário saber o número de uma série de caracteres ASCII.

Como mencionado acima, a posição de 0-31 e 127 ter caracteres de controlo. Number 32 é atribuído a um espaço, número 33-47 e 58-64 são reservados para operações de pontuação e matemática básica.

letras maiúsculas latino-arranjadas em ordem alfabética e são numerados de 65 º a 90 º. letras minúsculas também são dispostas por ordem alfabética, as suas posições – a partir de 97 ° a 122 °. Os números restantes (91-96 e 123-126) atribuídos aos suportes e cintas, característica oblíqua e linear, bem como algumas das marcas diacríticas.

mesa cheia de símbolos em uma representação gráfica conveniente pode ser visto na imagem acima. A figura abaixo mostra o número de sinais na tabela de caracteres ASCII russo.

ASCII estendido

Desde a versão original do código foi desenvolvido, com base no membro americano, não foram previstos não só vários tipos de escrita e alfabetos nacionais, mas até mesmo uma conveniente utilização de sinais diacríticos, ativamente usados em línguas europeias.

8 bits foi envolvido para a formação da codificação estendida. Esta versão inclui símbolos de alfabetos nacionais europeias e transcrição fonética, elementos gráficos, utilizados para mesas de desenho, uma série de símbolos matemáticos.

Alguns ASCII caracteres são raramente usados hoje. Em particular, isto se aplica a personagens que são usados para desenhar tabelas, como nos anos desde o desenvolvimento da codificação estendida, tanto formas mais convenientes de representação gráfica de tabelas foram introduzidas.

Nacional variantes de codificação

Antes do advento da versão ASCII estendido para exibir caracteres internacionais usados recondicionados de codificação versão, onde colocar as letras latinas foram colocados russo, grego, caracteres árabes.

Dois códigos na tabela são reservados para alternar entre os EUA-ASCII padrão e seu objetivo nacional.

Após o ASCII não ficou incluem 128 e 256 caracteres, se espalhou para a codificação de Opção, em que a versão original da tabela foi salvo nos primeiros 128 códigos com zero de dia 8 bit. Sinais literatura nacional armazenado na metade superior da mesa (128-255-th posição).

Para saber códigos de caracteres ASCII diretamente o usuário não é necessária. desenvolvedor de software é geralmente suficiente para saber o número do elemento na tabela para calcular o código, se necessário, usando o sistema binário.

língua russa

Após o desenvolvimento no início dos anos 70-s de codificações para os idiomas escandinavos, chinês, coreano, grego, etc., criando sua própria versão do engajados e da União Soviética. Logo desenvolveu versão da codificação de 8 bits chamado KOI8, preservando os primeiros 128 códigos de caracteres ASCII e atribui o mesmo número de posições sob as letras do alfabeto nacional e caracteres adicionais.

Antes da introdução do Unicode KOI8 dominado no segmento russo da Internet. Havia variantes de codificação para russo e para o alfabeto ucraniano.

problemas ASCII

Como o número de elementos, mesmo na tabela estendida não exceda 256, a possibilidade de acomodar uma única codificação vários scripts diferentes ausente. Na década de 90, houve um problema na RuNet "oops, o lixo", quando os caracteres ASCII russos texto digitado são exibidos incorretamente.

O problema era a discrepância de códigos de opções diferente ASCII outro. Lembre-se que em posições 128-255 podem ser colocados vários sinais, e quando você muda um conjunto caracteres cirílico para outro, todas as letras do texto foram substituídos por outros com o número idêntico em outros códigos de versão.

estado atual

Com o advento do Unicode popularidade ASCII diminuiu.

A razão para isso reside no fato de que os novos conjuntos de caracteres permitido para conter sinais de línguas quase todas escritas. Neste caso, os primeiros 128 caracteres ASCII correspondem ao mesmo caracteres Unicode.

Em 2000, foi a na internet e utilizado por 60% dos indexados "Google" páginas da web com código ASCII mais popular. Já em 2012, a proporção de tais páginas caiu para 17%, eo lugar da codificação mais popular tomou Unicode (UTF-8).

Assim, ASCII é uma parte importante da história da tecnologia da informação, mas o seu uso no futuro parece promissor.