Java123社区 - 轻松开发从此开始! 请登陆 免费注册

微科社区

当前位置:主页 > TAG标签 > 分词
  • 实战coreseek/sphnix,初探中文分词环境配置[jQuery]实战coreseek/sphnix,初探中文分词环境配置 2012-05-04

    环境: 操作系统:ubuntu coreseek:3.2 目的:对phpcms添加全文索引功能。 官方文档:http://www.coreseek.cn/docs/coreseek_3.2-sphinx_0.9.9.html ------------------------------ 进入coreseek的目录下进行安装: /u...

    67人浏览
  • 我用纯C语言开发的中英文混合分词服务器3.0正式[开发应用]我用纯C语言开发的中英文混合分词服务器3.0正式 2012-04-28

    我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例 百万商业圈中英文混合分词服务器3.0正式发布, 绝对稳定高效...

    53人浏览
  • Asp.net / C# 中利用SCWS中文分词[jQuery]Asp.net / C# 中利用SCWS中文分词 2012-04-24

    中文分词太麻烦了,也有些中文分词组件也不错,但要自己维护词库,我还是觉得麻烦,我尝试用SCWS中文分词,直接调用他的api,我什么都不需要做了,在此感谢一下。 废话不多说了...

    72人浏览
  • Lucene实用的分词匹配[ASP.NET]Lucene实用的分词匹配 2012-03-27

    本篇主要说一个lucene使用多个条件同时匹配的情况,如图所示 这个检索表示四个条件同时满足的结果,其中分类关键categoryname这个唯一字段,年级与科目比较复杂,它们两个同时关联...

    19人浏览
  • 用python调用ICTCLAS50进行中文分词[jQuery]用python调用ICTCLAS50进行中文分词 2012-03-23

    把你的程序和Date、ICTCLAS50.dll、Configure.xml放在一个目录下。#coding:gb2312 from ctypes import * dll=cdll.LoadLibrary("ICTCLAS50.dll") dll.ICTCLAS_Init(c_char_p(".")) lpText = u"计算所汉语词法分析系统ICTCLAS调用测...

    75人浏览
  • 关于scws分词的一些记录[jQuery]关于scws分词的一些记录 2012-03-20

    测试环境:windows 2003 + php5.3.5 + apache2.2 + scws 1.1.9 自定义词库,words.txt 如下: 腾讯1.01.0@ C++1.01.0! 中国人1.01.0! 就是1.01.0! 1.每行由4个字段组成,依次为词语"(由中文字或3个以下的字母合...

    53人浏览
  • ICTCLAS.NET——给C/C++程序写.NET wrapper[C#.NET]ICTCLAS.NET——给C/C++程序写.NET wrapper 2012-03-19

    很多时候想通过.NET调用一些C/C++写的库,但是一直都不知道怎么弄。去网上找了一些资料,大多数是教如何通过托管C++和非托管C++的混合编程来完成C/C++的的类库的.NET Wrapper。 有的时候...

    75人浏览
  • 一种正向最小匹配的中文分词算法[ASP.NET]一种正向最小匹配的中文分词算法 2012-03-19

    /// summary /// 根据字符串截取存在的词语算法(分词算法) /// /summary /// param name="sentence" 需要操作的语句 /param /// returns 所有在中文中存在的词语 /returns #region GetAllWords public ArrayList Get...

    70人浏览
  • 盘古分词-关键字搜索没有结果(关键字由未收录[ASP.NET]盘古分词-关键字搜索没有结果(关键字由未收录 2012-03-19

    由未收录词A、B、C等组成的任意组合在搜索时没有结果的问题。 解决方案很简单在设置中UnknownWordIdentify选项置为False就可以了。 下面是Pangu代码中处理段: if (count == 0) { if (_Options.Unk...

    51人浏览
  • HubbleDotNet 索引分词的测试方法和分词技巧[其他数据库]HubbleDotNet 索引分词的测试方法和分词技巧 2017-02-18

    在中文搜索中,分词技术是一个比较关键的技术,我们往往会遇到查询某个关键字无法匹配到相应文档的问题,这种问题往往都是索引的分词不理想造成的,倒排索引的技术特点决定了...

    55人浏览
推荐内容