Über Vercut
Vercut ist ein leistungsstarkes Online-Textsegmentierungstool, das Ihnen hilft, Text in Sätze, Phrasen und Wörter aufzuteilen. Es unterstützt mehrere Sprachen und liefert detaillierte Metadaten zu jedem Token.
Ob Sie Text analysieren, NLP-Anwendungen erstellen oder einfach nur neugierig sind, wie Text strukturiert ist – Vercut bietet eine intuitive Oberfläche zur Erkundung der Textsegmentierung.
- Mehrsprachige Unterstützung (Englisch, Deutsch, Spanisch, Französisch, Italienisch, Portugiesisch, Russisch)
- Vollständige Unicode- und CJK-Zeichenunterstützung
- Satz-, Phrasen- und Wortsegmentierung
- Detaillierte Token-Metadaten (Offsets, Satzzeichenmarkierungen)
- Saubere und intuitive Benutzeroberfläche
- Raw JSON-Export für die Integration
Vercut basiert auf der @echogarden/text-segmentation Bibliothek, die mithilfe einer Kombination aus regex-basierten Regeln und optionaler WebAssembly ICU-Segmentierung für CJK-Sprachen eine robuste mehrsprachige Textsegmentierung bietet.
Die Webanwendung ist mit React, TanStack Router und TailwindCSS erstellt.
Vercut ist Open Source und verfügbar auf GitHub. Beiträge, Fehlerberichte und Funktionsanfragen sind willkommen!