Vercut

여러 언어와 세분화 모드를 지원하는 강력한 온라인 텍스트 세분화 도구.

기능

텍스트 세분화에 필요한 모든 것

다국어 지원
영어, 독일어, 스페인어, 프랑스어, 이탈리아어, 포르투갈어, 러시아어 등을 지원합니다.
여러 세분화 모드
텍스트를 문장, 구문, 단어로 분할하고 상세한 메타데이터를 제공합니다.
Unicode & CJK 지원
중국어, 일본어, 태국어, 크메르어 및 모든 유니코드 스크립트를 완벽하게 지원합니다.
빠르고 가벼움
주로 정규식 기반이며 CJK 언어용 선택적 WebAssembly를 사용합니다.
상세한 토큰 분석
문자 오프셋, 구두점 마커 및 단어 경계를 가져옵니다.
오픈 소스
echogarden text-segmentation 라이브러리 위에 구축되었습니다.