当前位置:编程学习 > php >>

一个中文词典开源项目CC-CEDICT的介绍和下载

提供一份以汉语拼音为中文辅助的汉英辞典,截至2009年2月8日,已收录82712个单词。其词典可以用于中文分词使用,而且不存在版权问题。Chrome中文版就是使用的这个词典进行中文分词的

这个词词典这个网站是基于CC-CEDICT。CC-CEDICT是一个连续的CEDICT由保罗Denisowski项目开始于1997年,目的是提供一个完整的可下载的中国英语发音字典的拼音为汉字。这个网站允许你轻松地添加新条目或纠正在CC-CEDICT现有条目。提交条目将被检查和处理常常和下载CEDICT格式发布在这个页面上。
答案:1、cedict_1_0_ts_utf-8_mdbg.zip - CC-CEDICT in UTF-8, 与繁体及简体中文(Zip格式)
http://www.mdbg.net/chindict/export/cedict/cedict_1_0_ts_utf-8_mdbg.zip
2、cedict_1_0_ts_utf-8_mdbg.txt.gz - CC-CEDICT in UTF-8 与繁体及简体中文(GZip格式)http://www.mdbg.net/chindict/export/cedict/cedict_1_0_ts_utf-8_mdbg.txt.gz
3、更多下载和介绍:http://www.mdbg.net/chindict/chindict.php?page=cedict

上一个:HTTPCWS 是一款基于HTTP协议的开源中文分词系统
下一个:求关于“希尔伯特-黄”在DSP上实现的matlab代码

CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,