Vercut

Un puissant outil de segmentation de texte en ligne prenant en charge plusieurs langues et modes de segmentation.

Fonctionnalités

Tout ce dont vous avez besoin pour la segmentation de texte

Support multilingue
Prend en charge l'anglais, l'allemand, l'espagnol, le français, l'italien, le portugais, le russe et plus encore.
Modes de segmentation multiples
Segmentez le texte en phrases, expressions et mots avec des métadonnées détaillées.
Support Unicode & CJK
Prise en charge complète du chinois, japonais, thaï, khmer et de tous les scripts Unicode.
Rapide & Léger
Principalement basé sur les regex avec WebAssembly optionnel pour les langues CJK.
Analyse détaillée des tokens
Obtenez les décalages de caractères, les marqueurs de ponctuation et les limites de mots.
Open Source
Construit sur la bibliothèque echogarden text-segmentation.