Vercutについて
Vercutとは?
Vercutは、テキストを文、フレーズ、単語に分解するのに役立つ強力なオンラインテキストセグメンテーションツールです。複数の言語をサポートし、各トークンに関する詳細なメタデータを提供します。
テキストを分析したり、NLPアプリケーションを構築したり、テキストの構造に興味がある場合でも、Vercutはテキストセグメンテーションを探索するための直感的なインターフェースを提供します。
機能
- 多言語サポート(英語、ドイツ語、スペイン語、フランス語、イタリア語、ポルトガル語、ロシア語)
- 完全なUnicodeおよびCJK文字サポート
- 文、フレーズ、単語のセグメンテーション
- 詳細なトークンメタデータ(オフセット、句読点マーカー)
- クリーンで直感的なユーザーインターフェース
- 統合用のRaw JSONエクスポート
テクノロジー
Vercutは @echogarden/text-segmentation ライブラリの上に構築されており、正規表現ベースのルールとCJK言語用のオプションのWebAssembly ICUセグメンテーションを組み合わせて、堅牢な多言語テキストセグメンテーションを提供します。
WebアプリケーションはReact、TanStack Router、TailwindCSSで構築されています。
オープンソース
Vercutはオープンソースであり、 GitHubで利用可能です。貢献、バグ報告、機能リクエストを歓迎します!