当前位置:编程学习 > C#/ASP.NET >>

新闻系统的文章关键字自动提取,给点思路


我想在系统后台添加文章的时候,自动提取文章内容的关键字,然后放到到文本框中保存到数据库tag字段里。。。

关键就是:怎么提取关键字,希望大家给点思路,谢谢。 --------------------编程问答-------------------- 有这么牛吗?关键字不是自己录入的吗? --------------------编程问答-------------------- 关键自己录入 --------------------编程问答-------------------- 这个不大好做

你可以搜搜中文切词

一般都是用C++实现的 --------------------编程问答-------------------- 提取标题的关键字就行了,象QQ日志就有这功能,看看他们实现吧, --------------------编程问答--------------------
引用 4 楼 supper168 的回复:
提取标题的关键字就行了,象QQ日志就有这功能,看看他们实现吧,

额,麻烦您把QQ日志的源代码发给我............ --------------------编程问答-------------------- 睡搞过类似QQ日志提取关键字的东西吗? --------------------编程问答-------------------- 这个还真想过,想不太通 --------------------编程问答-------------------- dedecms 有这个功能 你看看 我没看过…… --------------------编程问答-------------------- 自己写把! --------------------编程问答-------------------- 牛啊  关键字 貌似都是自己输入 或者 直接标题 
--------------------编程问答-------------------- 难了,要分析中文句法。 --------------------编程问答-------------------- 录入新闻时加一个关键字字段,让他去录,一般都是这样做,用于检索 --------------------编程问答-------------------- 这个你要分析每句话的语法,才能找出关键字;建议手工输入关键字! --------------------编程问答--------------------
引用 12 楼 Lxpd 的回复:
录入新闻时加一个关键字字段,让他去录,一般都是这样做,用于检索



手动录入很麻烦,我就是想自动录入哟 --------------------编程问答-------------------- 太智能了。 --------------------编程问答-------------------- 中文分词,然后找关键字。最怕算法差搞了程序速度慢 --------------------编程问答-------------------- 和讯博客有这个功能   应该是有词库的 --------------------编程问答--------------------
引用 17 楼 ttg520 的回复:
和讯博客有这个功能  应该是有词库的


这个楼主用的到吗 --------------------编程问答--------------------
引用 18 楼 wanghao3616 的回复:
引用 17 楼 ttg520 的回复:
和讯博客有这个功能  应该是有词库的


这个楼主用的到吗



如果有词库也可以 --------------------编程问答-------------------- http://baidugoogle.net/demo/collect_keywords.html
之前写的一个DEMO,思路来自http://dev.misuland.com/20080327/1206614478727.html

由于嵌套循环太多,如输入较长文章的时候,会出现假死等现象. --------------------编程问答-------------------- 不会做,帮楼主顶。我也很想知道怎么做?听说是所一些常见的词放在一个记事本里做词库,然后再让你的标题或文章来比较你这个词库里的词 ,然后再存到数据库。呵呵,没做出来。 --------------------编程问答-------------------- 首先要 定义一个关键字 数据字典 
什么是关键字 有用户规定的。

然后,那文章内容 和数据字典 对比

简单实现就是 循环比较,
复杂的 要搞分词 比较 --------------------编程问答--------------------
引用 22 楼 eyuannet 的回复:
首先要 定义一个关键字 数据字典 
什么是关键字 有用户规定的。 

然后,那文章内容 和数据字典 对比 

简单实现就是 循环比较, 
复杂的 要搞分词 比较



同意 --------------------编程问答-------------------- 一般都是自己录。很少很切的 --------------------编程问答-------------------- 同意22楼 --------------------编程问答-------------------- --------------------编程问答-------------------- 定义一个关键字数据字典,然后拿文章内容和数据字典对比查找关键字。
--------------------编程问答-------------------- 不可能滴,请lz告诉我!

我现在说的这句话,那一个词是关键字????

关键字!!!!

有木有!!!有木有!!!

尼玛google退出中国!!!!!!

有木有!!!

原因?????

尼玛google对郭嘉说

尼玛啥根据郭嘉规定,那些内容的关键字俺们提取不出来!!!!!!

俺们根本就不知道啥是尼玛不符合规定的关键字!!!

有木有!!! --------------------编程问答-------------------- 囧 楼上有点愤世了 --------------------编程问答-------------------- 除非自己有词库 --------------------编程问答-------------------- 你可以试下建一个关键字字库,在新闻保存时判断下这些关键字是否出现在新闻里面 --------------------编程问答-------------------- 有一个关键字的表,这个是人家定义好的。

然后新闻出现关键字的表的数据时候,才找出来的。

QQ日志出现的关键字都是已经定义好的,不会从你文章中识别出来的。 --------------------编程问答-------------------- 应该有词库,应该还有很好的算法来做这个事情,要么处理量太大也很杯具。把热词提出来交给客户端JS去处理提取看看行不行 --------------------编程问答-------------------- sina  Blog就这样的,不会做,等高人。 --------------------编程问答-------------------- Tags 的概念就是由用户自行对文章进行分类。

你搞成这样,表面上说明系统功能很强大,但是损害了这个功能的基本功能。 --------------------编程问答-------------------- 牛人.... --------------------编程问答-------------------- 学习! --------------------编程问答--------------------

引用 28 楼 wanghui0380 的回复:
不可能滴,请lz告诉我!

我现在说的这句话,那一个词是关键字????

关键字!!!!

有木有!!!有木有!!!

尼玛google退出中国!!!!!!

有木有!!!

原因?????

尼玛google对郭嘉说

尼玛啥根据郭嘉规定,那些内容的关键字俺们提取不出来!!!!!!

俺们根本就不知道啥是尼玛不符合规定的关键字!!!

有木有!!!
--------------------编程问答-------------------- 想过,没好的思路,等待高人…… --------------------编程问答-------------------- 盘古分词组件可以实现
http://pangusegment.codeplex.com/SourceControl/list/changesets --------------------编程问答-------------------- 1.先建一个关键词过滤库,过滤库的结构可用反向匹配方式;
2.在添加新闻时,通过flex搜索关键词过滤库取得关键词;
3.运行用户修改关键词! --------------------编程问答-------------------- Discuz!NT 不是有这个功能么。  下载他们的源码 断点看看 他们是怎么做的。。。 --------------------编程问答-------------------- --------------------编程问答--------------------
引用 40 楼  的回复:
盘古分词组件可以实现
http://pangusegment.codeplex.com/SourceControl/list/changesets


对盘古分词可以实现 --------------------编程问答-------------------- 好想很复杂~~~路过
补充:.NET技术 ,  ASP.NET
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,