Konvertieren Sie die Zeichenfolge in Unicode Python

Konvertieren Sie die Zeichenfolge in Unicode Python
"Python" ist eine Computersprache. Es ist eine hochrangige Sprache, die weit verbreitet ist. Wenn wir über Python 2 sprechen, werden die Saiten dort als "Byte -Saiten" bezeichnet. Die Funktion Unicode () wird für die Umwandlung verwendet. In Python 3 gibt es integrierte Funktionen, die für die Umwandlung einer Zeichenfolge in Unicode verwendet werden können. Wir werden die Konvertierung für ein besseres Verständnis weiter diskutieren. Die Beispiel -Implementierung, die wir im Artikel für die Konvertierungsleistung der String -zu -Unicode ausführen werden, kann in einer der Python -Versionen verwendet werden.

Wichtiger Hinweis:

Ein kleiner Fehler tritt zeitweise während der Konversionsleistung auf. Eine kleine Veränderung oder sogar nur ein einzelner Charakter oder eine einzige Zahl macht einen großen Unterschied, da es sich um die Konversionsleistung handelt. Es gibt einige wichtige Konzepte und Erklärungen für die grundlegende Arbeit, die man vor der Konversionsleistung kennen sollte.

Was ist eine Schnur in Python?

Die Zeichenfolge ist eine Abfolge von Zeichen, die auch als Array bezeichnet werden können. In Python funktioniert es genauso wie andere Programmiersprachen wie ein Int, Char, Bool, Float usw. Die Zeichenfolge in Python ist das Array von Bytes, das die Unicode -Zeichen darstellt. Die Stringwerte sind von den Zitaten umgeben. Sie können einzelne Zitate ('), Doppelzitate (") und dreifache Zitate (") sein. Verwenden Sie auch die gleichen Zitate, während Sie den Zeichenfolge öffnen und schließen. Wenn wir bei der Öffnung ein einzelnes Zitat verwenden und es mit zwei Zitaten schließen, tritt der Fehler auf. Wenn eine Zeichenfolge erstellt wird, wandelt das Computersystem es in die Kombination von 1 und 0 um. Diese Konvertierung wird als Codierung bezeichnet. Wir werden das in den folgenden Beispielen tun.

Was ist Unicode in Python?

Unicode erledigt die Arbeit, jedes der Zeichen oder Symbole zu korrelieren, die mit einer bestimmten Anzahl von eigenen angegeben sind. Jede eindeutige Zahl wird als Codepunkt bezeichnet. Der Codepunkt ist der Wert einer Ganzzahl, der von „0 bis 0 * 10ffff“ bei der Codierung der Hexa -Dezimalzahl variiert. Die Ein-Charakter-Zeichenfolge kann mit dem CHR () erstellt werden, der eine integrierte Funktion in Python ist. Es nimmt das Argument als einzelne Ganzzahl an und gibt den Unicode des angegebenen Charakters zurück. In Python „ord ()“ gibt es eine weitere integrierte Funktion, die wie eine CHR () -Funktion funktioniert.

Die Methoden zur Konvertierung von String in Unicode in Python:

Im Folgenden werden wir Beispiele für die Umwandlung von String in Unicode in Python implementieren:

  • Konvertierung von String in Unicode unter Verwendung der Encode -Methode in Python.
  • Konvertierung von String in Unicode mithilfe von CODE -Methodenfehler, die in Python auftritt.
  • Konvertierung von String in Unicode mithilfe (Join+Format+Wort) in Python.
  • Konvertierung von String in Unicode mit (ord+lambda+re.Sub) in Python.

Beispiel Nr. 01: Konvertierung von String in Unicode mithilfe der Encode -Methode in Python:

In diesem Fall werden wir lernen, wie der einfache Zeichenfolgewert mithilfe der Codierungsmethode in Unicode umgewandelt wird. Das als "codode ()" verwendete "Codierung" ist eine Methode, die ein codierter Wert einer Zeichenfolge ist. Die Codierung wird auch als Zeichencodierung bezeichnet, da die Codepunkte in eine Abfolge von Bytes konvertiert werden. Die Codierungstypen können wie "ASCII-Zeichen", "utf = 8", "utf-16" usw. sein.

Standardmäßig verwendet Python die UTF-8-Codierung. Das "UTF" steht für das "Unicode -Transformationsformat" und das "8" damit für die Codierung der Werte, die 8 Bit sind. Wir können 1 bis 4 Bytes lange Zeichen in der UTF-8-Codierungsleistung verwenden. Der hier angegebene String -Wert ist „Nö“ zur Umwandlung auf Unicode. Anschließend ist die Syntax nach Zuweisung des Wertes für die Konvertierung geschrieben. Die methode enCode () nimmt standardmäßig keinen Parameter an, wie wir in Zeile 2 im Code sehen können.

Anschließend wird die Druckfunktion für die Druckergebnisse zur Ausgabe der Konvertierung verwendet. Der Wert kann auch einen Fehler zurückgeben, wenn die Codierung nicht ordnungsgemäß gemäß der Codierungsmethode verarbeitet werden kann.

Der Ausgang zeigt den konvertierten String in Unicode erfolgreich mithilfe der methode enCode () an.

Beispiel Nr. 02: Konvertierung von String in Unicode mithilfe von Incodemethodenfehler in Python:

In diesem Fall werden wir die Zeichenfolge mit der Encoder -Fehlermethode in Unicode konvertieren. Es gibt viele Parameter der Unicode -Fehlermethode. Hier folgen wir dem Backslash -Ersatz einer. Hier ist die Saite, die wir für die Umwandlung ausgewählt haben, „Örange“,. Der Codierungscode der Syntax mit dem Parameterfehler als Backslash ersetzen. Verwenden Sie dann die Druckfunktion für den Druck, um die Konvertierung auf dem Ausgangsbildschirm anzuzeigen.

Die Ausgabe zeigt die Konvertierung des Zeichens zu Unicode mit der Codierungsfehlermethode in Python. Wir können sehen, dass der Ausgang "xs6" enthält, was die Unicode -Anzahl der "ö" ist. Das o mit den zwei Punkten darauf. Der Rest des Charakters wird so gedruckt, wie er ist.

Beispiel # 03: Konvertierung der String in Unicode mithilfe (Join+Format+ord) in Python:

In diesem Beispiel werden wir sehen, wie die Konvertierung der Zeichenfolge mit drei Funktionen in Unicode durchführt. Die drei Funktionen, die wir in diesem Beispiel verwenden werden, sind (), format () und ord () verbunden (). Zunächst müssen wir den regulären Ausdruck als „Import Re“ importieren. Initialisieren Sie dann die Zeichenfolge hier. Wir haben die Schnur als "Wasser die Pflanzen" genommen ". Drucken Sie zuerst die Testzeichenfolge aus und wenden Sie dann die Funktion des Formats für das Conversion Join (), format () und die ord () -Methode insgesamt an. Anschließend wird die Druckfunktion zum Drucken der Ausgangsanzeige verwendet.

Der Anzeigebildschirm zeigt den Unicode an, das mit den Methoden join (), format () und join () konvertiert wurde. Jeder String -Wert hat seinen Unicode, wie im folgenden Ausgang gezeigt.

Beispiel # 03: Konvertierung der String in Unicode (ord+lambda+re.Sub) in Python:

Hier werden wir die Konvertierung der Zeichenfolge in Unicode mit den drei Funktionen erneut ausführen. In diesem Beispiel sind die verwendeten Funktionen "ord ()", "lambda ()" und "re. Sub ”. Wir müssen den regulären Ausdruck hier importieren, wie in Beispiel 2. Dann müssen wir die Zeichenfolge für die Konvertierung initialisieren. Wir haben die Saite als "Der Himmel ist blau" initialisiert. Drucken Sie dann die Zeichenfolge für die weitere Verarbeitung aus. Danach werden wir die Funktion sub () verwenden, um die Substitutionen auszuführen. Wir werden auch die Funktion ord () verwenden, die für die Umwandlung der Zeichenfolge verwendet wird. Die verwendete Lambda () dient zur Erstellung anonymer Funktionen zusammenarbeiten. Verwenden Sie dann die Druckfunktion für den Druck mit verwendet.

In der Anzeige können wir die Umwandlung der String in Unicode sehen, die durchgeführt wird.

Abschluss:

In diesem Artikel haben wir verstanden, wie die Konvertierung der Zeichenfolge zu einem Unicode durchgeführt werden kann. Es ist eine hilfreiche Methode, die die Ausführung direkt ausführen kann, anstatt sie einzeln für jeden Charakter zu tun. Wir haben alle Szenarien mit Hilfe der Implementierung der Beispiele gelöscht, die uns helfen, besser zu verstehen. Wir haben die Konvertierung des String in Unicode mithilfe der Encodemethode und auch mit der Codemethode mit dem Parameter -Backslash durchgeführt. Wir haben auch die Umwandlung einer String mit den drei Methoden als ord (), lambda () und re durchgeführt. sub () und der andere unter Verwendung von Join (), format () und ord () in Python.