以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  下一代数据挖掘工具是什么样子?  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=48017)


--  作者:yhboston
--  发布时间:6/5/2007 11:11:00 AM

--  下一代数据挖掘工具是什么样子?

最近,Gartner发布了07年一季度的客户数据挖掘产品魔力幻方(Magic Quadrant for Customer Data Mining, 2Q07 如图), 在领导者、挑战者、利基市场和远见卓识四个象限中,SAS和SPSS占据领导者象限,仍然没有产品对这两者的统治地位具有任何挑战,所以挑战者是一片空白,大多数小的厂商都仅仅占有利基市场,值得注意的是在“远见卓识家”象限,KXEN和Portrait software独树一帜。
数据挖掘在国内的市场,还是需要一段时间,首先要有大量数据的积累,这点来说,电信、证券和银行行业已经满足,其次,最终应用数据挖掘的客户,必须面对着同类客户的竞争,所以他们要做客户细分,要针对不同的客户群定制自己的产品;要做分类模型来预测自己将要流失的客户,进行客户挽留;要对产品的销售进行捆绑,提高竞争力;要对客户的生命周期进行不同点的控制。从后者来说,我们的客户远远没有到这个需求,譬如,我们有很多银行,但是,现在大家都在讨论银行的排队问题,普通老百姓排队排到发狂:天津老汉被尿憋晕、深圳男子当众撒尿,我们的歇斯底里正是说明这些垄断行业没有面对竞争的压力,也不需要增加自己的竞争力,何来数据挖掘的需要呢?
SAS是BI领域最具竞争力的厂商之一,近40年的历史,在统计领域的绝对权威地位,造就了这个受人尊敬的软件公司,就数据挖掘来说,不仅是一个SAS/EM,而是基于所有的产品之上的行业解决方案。相对来说,SPSS的Clementine是一个拙劣的效仿产品,但是市场就是硬道理,SPSS以其低廉的价格和良好的服务占有了很大的市场份额。如今,数据仓库的厂商都开始着力于数据挖掘产品,譬如,IBM的IM,Microsoft的分析服务,Oracle和Teradata也都有自己的数据挖掘产品,对于独立的单纯做数据挖掘的厂商而言,生存越来越不易。
客户需要明白的是,数据挖掘是业务需求驱动,而绝不是技术驱动的,但是,现在的大多数据挖掘产品,却不是这样,我们要建立的模型,总是基于一个算法,然后,基于算法的需求去做维度选择,数据预处理,去展示模型的结果,对模型进行解释,这种思路是SAS的罪过,因此,数据挖掘被当作一项昂贵的技术,“数据挖掘是一种艺术”,但是,我们却被束缚在技术的层面而不能大施拳脚。但是,趋势绝会改变。

--  作者:DMman
--  发布时间:6/5/2007 11:24:00 AM

--  
数据挖掘是业务需求驱动,而绝不是技术驱动的,但是,现在的大多数据挖掘产品,却不是这样,我们要建立的模型,总是基于一个算法,然后,基于算法的需求去做维度选择,数据预处理,去展示模型的结果,对模型进行解释,这种思路是SAS的罪过,因此,数据挖掘被当作一项昂贵的技术,“数据挖掘是一种艺术”,但是,我们却被束缚在技术的层面而不能大施拳脚。但是,趋势绝会改变。


  我顶!“数据挖掘是业务需求驱动,而绝不是技术驱动的”数据挖掘的技术已经成熟了,应用中的数据整理和输出评估是非常重要而且需要人来完成 不能被机器或软件所替代的。虽然软件能集成部分人类的智慧,但至少现在数据挖掘软件还不能,或许将来也不能!
  被束缚在技术的层面,不是SAS的错。SAS也是应运而生,只是时代的潮流需要他改变了,当初的SAS是无可厚非的。作为一门通用型的挖掘软件,我们对它苛求不能太多了。也正是需求的扩大,行业性的软件呼之欲出,使SAS显得落伍了。
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms