当前位置:编程学习 > C#/ASP.NET >>

求解最高相似性

我手头有一个1750行 100列的excel数据表
单元格数据均以0或1填充

要求以1为条件
找出最相似的50行

我想知道做个程序去实现的复杂程度,及算法思路 --------------------编程问答-------------------- 聚类算法。

用matlab去做。 --------------------编程问答-------------------- 方法之一:统计各行的平均值和方差,以此为条件求出最相近的50行。 --------------------编程问答-------------------- 谢谢大家
--------------------编程问答-------------------- 还有一个问题
就是如果连在一起,那么他们的相似度就要高一点
你要考虑这个问题,呵呵
比如:
11111111111110000000000
11111100000111111100000
10101010101001010101010
--------------------编程问答-------------------- 看看。。。。 --------------------编程问答--------------------
引用 1 楼 caozhy 的回复:
聚类算法。

用matlab去做。

哥们也是搞机器学习的?? 

我不知楼主这一百列的属性到底怎么样,以及他们的影响因子或者权重如何,如caozhy 所说,用聚类算法吧,按照你的50行相似,直接采用凝集算法,当某个集合达到50就停止输出。
补充:.NET技术 ,  C#
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,