Diakritika im Text automatisch erzeugen lassen

Strokes - Tschechisch 100+101+201

Wie schön wäre es, wenn Sie beim Schreiben tschechischer Texte auf die diakritischen Zeichen verzichten könnten und stattdessen ein Programm sie im Nachhinein selbst hinzufügt?

Genau das bewerkstelligt das Online-Programm CZACCENT des Zentrums für natürliche Sprachverarbeitung der Informatik-Fakultät der Masaryk-Universität in Brünn.

Ich habe es kurz mit einem Satz aus dieser Meldung des Tages getestet.

Zunächst den Satz ohne Diakritika eingegeben:

Cesti hokejiste skoncili stejne jako v predchozich dvou letech uz ve ctvrtfinale mistrovstvi sveta.

CZACCENT hat diesen Satz umgewandelt in:

Čeští hokejisté skončili stejně jako v předchozích dvou letech už ve čtvrtfinále mistrovství světa.

Der Satz ist nach der Konvertierung orthographisch 100% richtig. Alle Diakritika stimmen. Dennoch sollten Sie vorsichtshalber einen Blick auf das Ergebnis werfen, falls Sie einen wichtigen Text schreiben.  Ich weiß nicht, ob das Programm jeder Prüfung standhält.

Es gibt noch ein Tool, das Diakritika hinzufügt, aber das nur halbautomisch und es steht auch nicht online zur Verfügung, sondern muss auf dem Rechner installiert werden. Es ist das Tool cz2cz, das ich im Posting Konverter für tschechische Zeichensätze beschrieben habe.

VN:F [1.9.0_1079]
Rating: 0.0/10 (0 votes cast)

Jetzt Neu!: Tschechisch-Tasse mit der tschechischen Redewendung "Co je české, to je hezké!"

    • fadingerstefan
    • Mai 11th, 2009 1:57pm

    schade dass sie nicht gewonnen haben!

    UN:F [1.9.0_1079]
    Rating: 0.0/5 (0 votes cast)
  1. Ja, schade. In der Unterzahl (wegen pingeligem Schiedsrichter) die ersten zwei Tore kassiert.
    Aber das Tor in Unterzahl 3 gegen 5 war auch nicht schlecht.

    UA:F [1.9.0_1079]
    Rating: 0.0/5 (0 votes cast)
    • karin
    • Mai 20th, 2009 1:21pm

    Hallo Petra, danke für den Hinweis aud CZACCENT. Meine Frage (weil ich zu faul bin, das erst auszuprobieren: Kommt der Text dann beim Empfänger lesbar an – also ohne die üblichen Hieroglyphen?

    UN:F [1.9.0_1079]
    Rating: 0.0/5 (0 votes cast)
    • @karin Der Output von CZACCENT hat die ISO-8859-2-Kodierung. Wenn das Email-Programm des Absenders und des Empfängers die Kodierung des Textes als ISO-8859-2 erkennt, bleibt der Text 1:1 erhalten (in diesem Fall lesbar in der ISO-8859-2-Kodierung).
      Heutige Email-Programme erkennen die richtige Kodierung des Textes (dabei auf die neueste Version des Emails-Programm achten. Vorallem beim Outlook.). Wenn der Text beim Empfänger dennoch nicht lesbar ankommt, dann empfiehlt sich zum Abschicken von Emails im Email-Programm die UTF-8-Kodierung einzustellen.

      UA:F [1.9.0_1079]
      Rating: 0.0/5 (0 votes cast)
    • karin
    • Mai 20th, 2009 1:22pm

    Ergänzung: bei j e d e m Empfänger, egal welce Software er hat?

    UN:F [1.9.0_1079]
    Rating: 0.0/5 (0 votes cast)
    • Ja, bei *jedem* Empfänger, wenn er ein gutes Email-Programm hat. Sprich, wenn das Programm fähig ist die Kodierung zu erkennen.

      UA:F [1.9.0_1079]
      Rating: 0.0/5 (0 votes cast)
    • Juliane
    • Mai 31st, 2009 11:30pm

    wieder so ein nützlich Ding. Danke für den guten Tip. (Ich verweigere michd er neuen dt. Rechtschreibung wo immer es geht ;-)

    UN:F [1.9.0_1079]
    Rating: 0.0/5 (0 votes cast)
  1. No trackbacks yet.