Vercut

複数の言語とセグメンテーションモードをサポートする強力なオンラインテキストセグメンテーションツール。

機能

テキストセグメンテーションに必要なすべて

多言語サポート
英語、ドイツ語、スペイン語、フランス語、イタリア語、ポルトガル語、ロシア語などをサポート。
複数のセグメンテーションモード
テキストを文、フレーズ、単語に分割し、詳細なメタデータを提供。
Unicode & CJKサポート
中国語、日本語、タイ語、クメール語、およびすべてのUnicodeスクリプトを完全サポート。
高速&軽量
主に正規表現ベースで、CJK言語用のオプションWebAssemblyを使用。
詳細なトークン分析
文字オフセット、句読点マーカー、単語境界を取得。
オープンソース
echogarden text-segmentationライブラリの上に構築。