Kodierung von Textinformationen in dem Computer

Computer – ein hoch entwickeltes Gerät , mit dem Sie erstellen können, konvertieren und Informationen speichern. Allerdings wird der Computer nicht sehr verständlich für uns arbeiten – Grafik, Text und numerische Daten als binäre Arrays gespeichert Codierungstextinformationen Zahlen. In diesem Artikel werden wir an, wie die Codierung der Textinformationen suchen.

Was für uns ist der Text eines Computers – eine Folge von Zeichen. Jedes Symbol stellt einen bestimmten Satz von Nullen und Einsen. Unter den Symbolen bedeutete nicht nur Groß- und Kleinbuchstaben des lateinischen Alphabets, sondern auch Satzzeichen, Rechenzeichen, Sonderzeichen, Sonderzeichen und sogar Raum.

Binäre Codierung von Textinformationen

Durch Drücken sendet eine bestimmte Taste auf dem internen Regler ein elektrisches Signal , das zu einem umgewandelt wird Binärcode. Code mit einem bestimmten Symbol abgestimmt, die auf dem Bildschirm angezeigt wird. Zur Vorlage an das lateinische Alphabet in ein digitales Format ASCII – Codierung internationalen System erstellt wurde. Es erfordert 1 Byte für die Aufzeichnung von einem Symbol besteht somit aus acht Symbolfolge von Nullen und Einsen. Das Aufzeichnungsintervall – 00000000 bis 11111111, dh Kodierung von Textinformationen mit diesem System ermöglicht es uns, 256 Zeichen darzustellen. In den meisten Fällen ist dies ausreichend. binäre Codierung Textinformationen

ASCII ist in zwei Teile geteilt. Die ersten 127 Zeichen (00.000.000 bis 01.111.111) sind international und sind bestimmte Symbole und Buchstaben des englischen Alphabets. Der zweite Teil – die Verlängerung (10.000.000 bis 11.111.111) – sollte das nationale Alphabet darstellen, das Schreiben von dem aus dem lateinischen unterscheidet.

Encoding Textinformationen in ASCII basieren auf dem Prinzip der zunehmenden Reihenfolge aufgebaut, das heißt, je größer die Sequenz Anzahl der Buchstaben, desto größer ist der Wert seines ASCII-Code. Die Zahlen und russischen Teil der Tabelle auf dem gleichen Prinzip aufgebaut.

Doch in der Welt gibt es verschiedene Arten von Codierung für kyrillische Buchstaben. Die häufigste – ist KOI-8 (Acht-Bit-Codierung, die in der ersten ruifitsirovannyh Unix für Betriebssystem in den 70er Jahren verwendet wurde) in der der CP 1251 (Kodierung von Textinformationen verwendet, ISO 8859-5 (vom Internationalen Büro für die Standardisierung entwickelt) Codierung und Verarbeitung von Textinformationen moderne OS Windows) sowie 2-Byte-Kodierung von Unicode, die verwendet werden können 65.536 Zeichen einzuführen. Eine solche Vielzahl von Kodierungen aufgrund der Tatsache, dass sie zu unterschiedlichen Zeiten entwickelt wurden, für verschiedene Betriebssysteme und verschiedene Überlegungen. Aus diesem Grund, haben oft Schwierigkeiten, wenn der Text von einem Medium zum anderen übertragen – von einer Nichtübereinstimmung der Benutzer codiert, wird eine Reihe von verwirrenden Symbole angezeigt. Wie kann ich diese Situation beheben? In Word, zum Beispiel, wenn ein Dokument geöffnet wird, bietet eine Meldung über Probleme mit Textanzeige und mehrere Optionen für die Transkodierung.

Somit Codierung und Verarbeitung von Textinformationen in den Eingeweiden des Computers – der Prozess ist schwierig und zeitaufwendig organisiert. Alle Symbole eines Alphabets sind nur eine bestimmte Ziffernfolge von binären System einer Zelle – das ist ein Byte an Informationen.