Über Vercut

Was ist Vercut?

Vercut ist ein leistungsstarkes Online-Textsegmentierungstool, das Ihnen hilft, Text in Sätze, Phrasen und Wörter aufzuteilen. Es unterstützt mehrere Sprachen und liefert detaillierte Metadaten zu jedem Token.

Ob Sie Text analysieren, NLP-Anwendungen erstellen oder einfach nur neugierig sind, wie Text strukturiert ist – Vercut bietet eine intuitive Oberfläche zur Erkundung der Textsegmentierung.

Funktionen
  • Mehrsprachige Unterstützung (Englisch, Deutsch, Spanisch, Französisch, Italienisch, Portugiesisch, Russisch)
  • Vollständige Unicode- und CJK-Zeichenunterstützung
  • Satz-, Phrasen- und Wortsegmentierung
  • Detaillierte Token-Metadaten (Offsets, Satzzeichenmarkierungen)
  • Saubere und intuitive Benutzeroberfläche
  • Raw JSON-Export für die Integration
Technologie

Vercut basiert auf der @echogarden/text-segmentation Bibliothek, die mithilfe einer Kombination aus regex-basierten Regeln und optionaler WebAssembly ICU-Segmentierung für CJK-Sprachen eine robuste mehrsprachige Textsegmentierung bietet.

Die Webanwendung ist mit React, TanStack Router und TailwindCSS erstellt.

Open Source

Vercut ist Open Source und verfügbar auf GitHub. Beiträge, Fehlerberichte und Funktionsanfragen sind willkommen!