À propos de Vercut
Vercut est un puissant outil de segmentation de texte en ligne qui vous aide à décomposer le texte en phrases, expressions et mots. Il prend en charge plusieurs langues et fournit des métadonnées détaillées sur chaque token.
Que vous analysiez du texte, construisiez des applications NLP ou que vous soyez simplement curieux de savoir comment le texte est structuré, Vercut fournit une interface intuitive pour explorer la segmentation de texte.
- Support multilingue (anglais, allemand, espagnol, français, italien, portugais, russe)
- Prise en charge complète d'Unicode et des caractères CJK
- Segmentation de phrases, expressions et mots
- Métadonnées de token détaillées (décalages, marqueurs de ponctuation)
- Interface utilisateur propre et intuitive
- Export JSON brut pour l'intégration
Vercut est construit sur la bibliothèque @echogarden/text-segmentation , qui fournit une segmentation de texte multilingue robuste en utilisant une combinaison de règles basées sur les regex et une segmentation ICU WebAssembly optionnelle pour les langues CJK.
L'application web est construite avec React, TanStack Router et TailwindCSS.
Vercut est open source et disponible sur GitHub. Les contributions, rapports de bugs et demandes de fonctionnalités sont les bienvenus !