算法

算法

关于文本内容提取的问题,请大神指教一下

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 44 次浏览 • 2017-02-16 18:24 • 来自相关话题

根据商品大类和其下各子类目、叶子类目销量TOP100的排行,怎么挖掘得出大类TOP1000的排行?

算法 数据男孩 回复了问题 • 1 人关注 • 2 个回复 • 102 次浏览 • 2017-02-04 15:39 • 来自相关话题

[割边]代码结果有问题

算法 邹博 回复了问题 • 3 人关注 • 1 个回复 • 55 次浏览 • 2016-12-21 23:05 • 来自相关话题

链表 部分翻转

算法 fish 回复了问题 • 2 人关注 • 1 个回复 • 57 次浏览 • 2016-12-08 09:48 • 来自相关话题

【数组】子集和数带负数的分支限界

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 60 次浏览 • 2016-12-07 13:12 • 来自相关话题

KMP的代码,结果为0 ,不知道哪里有问题

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 66 次浏览 • 2016-12-07 11:27 • 来自相关话题

字符串面试题,判断单字符变换

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 63 次浏览 • 2016-11-24 12:29 • 来自相关话题

【海量数据】跳表的插入

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 84 次浏览 • 2016-11-23 22:29 • 来自相关话题

素和阶数问题

算法 邹博 回复了问题 • 2 人关注 • 3 个回复 • 74 次浏览 • 2016-11-12 08:33 • 来自相关话题

EM算法中M步的一个问题

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 91 次浏览 • 2016-11-11 14:29 • 来自相关话题

[海量数据]回文对问题

算法 邹博 回复了问题 • 3 人关注 • 1 个回复 • 71 次浏览 • 2016-11-11 14:17 • 来自相关话题

动态规划(Scramble String)

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 87 次浏览 • 2016-11-03 11:58 • 来自相关话题

动态规划(分割词汇)

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 91 次浏览 • 2016-10-28 12:18 • 来自相关话题

动态规划(操作最少次数)

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 77 次浏览 • 2016-10-25 17:04 • 来自相关话题

迷离傍地走的答案不懂

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 78 次浏览 • 2016-10-19 12:24 • 来自相关话题

邹老师,两个关于算法课的问题

算法 邹博 回复了问题 • 3 人关注 • 1 个回复 • 140 次浏览 • 2016-10-10 10:51 • 来自相关话题

请详细描述一下链表有环公共借点与快慢指针这个问题

回复

算法 Holy_Book 发起了问题 • 2 人关注 • 0 个回复 • 72 次浏览 • 2016-10-07 23:17 • 来自相关话题

Leetcode 229. Majority Element II

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 87 次浏览 • 2016-10-05 18:34 • 来自相关话题

字符串相似度比较:LCS和最短编辑距离的异同

算法 邹博 回复了问题 • 2 人关注 • 3 个回复 • 180 次浏览 • 2016-09-30 23:36 • 来自相关话题

关于文本内容提取的问题,请大神指教一下

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 44 次浏览 • 2017-02-16 18:24 • 来自相关话题

根据商品大类和其下各子类目、叶子类目销量TOP100的排行,怎么挖掘得出大类TOP1000的排行?

回复

算法 数据男孩 回复了问题 • 1 人关注 • 2 个回复 • 102 次浏览 • 2017-02-04 15:39 • 来自相关话题

[割边]代码结果有问题

回复

算法 邹博 回复了问题 • 3 人关注 • 1 个回复 • 55 次浏览 • 2016-12-21 23:05 • 来自相关话题

链表 部分翻转

回复

算法 fish 回复了问题 • 2 人关注 • 1 个回复 • 57 次浏览 • 2016-12-08 09:48 • 来自相关话题

【数组】子集和数带负数的分支限界

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 60 次浏览 • 2016-12-07 13:12 • 来自相关话题

KMP的代码,结果为0 ,不知道哪里有问题

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 66 次浏览 • 2016-12-07 11:27 • 来自相关话题

字符串面试题,判断单字符变换

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 63 次浏览 • 2016-11-24 12:29 • 来自相关话题

【海量数据】跳表的插入

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 84 次浏览 • 2016-11-23 22:29 • 来自相关话题

素和阶数问题

回复

算法 邹博 回复了问题 • 2 人关注 • 3 个回复 • 74 次浏览 • 2016-11-12 08:33 • 来自相关话题

EM算法中M步的一个问题

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 91 次浏览 • 2016-11-11 14:29 • 来自相关话题

[海量数据]回文对问题

回复

算法 邹博 回复了问题 • 3 人关注 • 1 个回复 • 71 次浏览 • 2016-11-11 14:17 • 来自相关话题

动态规划(Scramble String)

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 87 次浏览 • 2016-11-03 11:58 • 来自相关话题

动态规划(分割词汇)

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 91 次浏览 • 2016-10-28 12:18 • 来自相关话题

动态规划(操作最少次数)

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 77 次浏览 • 2016-10-25 17:04 • 来自相关话题

迷离傍地走的答案不懂

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 78 次浏览 • 2016-10-19 12:24 • 来自相关话题

邹老师,两个关于算法课的问题

回复

算法 邹博 回复了问题 • 3 人关注 • 1 个回复 • 140 次浏览 • 2016-10-10 10:51 • 来自相关话题

请详细描述一下链表有环公共借点与快慢指针这个问题

回复

算法 Holy_Book 发起了问题 • 2 人关注 • 0 个回复 • 72 次浏览 • 2016-10-07 23:17 • 来自相关话题

Leetcode 229. Majority Element II

回复

算法 邹博 回复了问题 • 2 人关注 • 1 个回复 • 87 次浏览 • 2016-10-05 18:34 • 来自相关话题

字符串相似度比较:LCS和最短编辑距离的异同

回复

算法 邹博 回复了问题 • 2 人关注 • 3 个回复 • 180 次浏览 • 2016-09-30 23:36 • 来自相关话题

大数据分析之机器学习算法实现的演化

机器学习 唐半张 发表了文章 • 0 个评论 • 495 次浏览 • 2015-10-11 09:51 • 来自相关话题

大数据的广泛应用,着这样的背景下是值得我们研究与学习的。大数据分析 机器学习算法实现的演化 。首先,这里列出了目前可用的三代机器学习工具。 [list=1] 传统的机器学习和 数据分析 的工具,包括SAS,IBM的SPSS,Weka以及R语言。它们可以...
查看更多

为什么要思考算法

算法 唐半张 发表了文章 • 0 个评论 • 336 次浏览 • 2015-10-11 09:26 • 来自相关话题

中国古代《周髀算经》卷上有:“数之法出于圆方。圆出于方,方出于矩。矩出于九九八十一”。意思是: 算数的方法都出于对圆、对方的计算,其中圆出于方(圆形面积=外接正方形x圆周率/4),方出于矩(正方形源自两边相等的矩),矩的计算出于九九八十一 (长乘宽面积的计算依...
查看更多

KMeans算法和简单命令使用

算法 唐半张 发表了文章 • 0 个评论 • 807 次浏览 • 2015-10-10 09:54 • 来自相关话题

KMeans算法和简单命令使用   算法简介  同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小  以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。  首先从n个数据对象任意选...
查看更多

mahout bayes(贝叶斯)算法研究(2)

算法 唐半张 发表了文章 • 0 个评论 • 383 次浏览 • 2015-10-10 09:52 • 来自相关话题

mahout bayes(贝叶斯)算法研究 接前面的mahout-bayes(贝叶斯)算法研究(1) 9. 输出数据含义分析与研究     这个混合矩阵的意思说明:  上述a到u分别是代表了有20类别,这就是我们之前给的20个输入文件         ...
查看更多

mahout bayes(贝叶斯)算法研究(1)

mahout 唐半张 发表了文章 • 0 个评论 • 501 次浏览 • 2015-10-10 09:52 • 来自相关话题

mahout bayes(贝叶斯)算法研究 朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率哪个最大,就认为此待分类项属于哪...
查看更多

讲讲义中K-means聚类实例修正

算法 唐半张 发表了文章 • 0 个评论 • 370 次浏览 • 2015-10-09 10:24 • 来自相关话题

步骤1:下载测试数据(格式为SGML): http://www.daviddlewis.com/resou ... reuters21578.tar.gz 步骤2:将数据解压 $ mkdir -p mahout-work/reuters-sgm...
查看更多

利用Mahout实现在Hadoop上运行K-Means算法

mahout 唐半张 发表了文章 • 0 个评论 • 348 次浏览 • 2015-10-09 09:14 • 来自相关话题

 Mahout是Apache下的开源机器学习软件包,目前实现的机器学习算法主要包含有 协同过滤/推荐引擎 , 聚类 和 分类 三个部分。Mahout从设计开始就旨在建立可扩展的机器学习软件包,用于处理大数据机器学习的问题,当你正在研究的数据量大到...
查看更多

贝叶斯分类算法示例

算法 唐半张 发表了文章 • 0 个评论 • 505 次浏览 • 2015-10-06 11:18 • 来自相关话题

摘要:  贝叶斯分类器的分类原理发源于古典概率理论,是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率 的类作为该对象所属的类。朴素贝叶斯分类器(Naive Bayes Classifier)做了一个简单...
查看更多

基于K-means算法的树叶分类

算法 唐半张 发表了文章 • 0 个评论 • 496 次浏览 • 2015-10-06 11:15 • 来自相关话题

现有n片不同种类的树叶,编写程序,完成对它们的自动分类。采用基于K-means算法的方法来完成分类。        K-means算法的处理流程如下。首先,随机或按一定规则选择k个对象,每个对象代表一个簇的初始均值或中心。对剩余的每个对象,根据其与各个簇...
查看更多

mahout中kmeans算法和Canopy算法实现原理

mahout 唐半张 发表了文章 • 0 个评论 • 464 次浏览 • 2015-10-06 11:14 • 来自相关话题

本文讲一下mahout中kmeans算法和Canopy算法实现原理。   一. Kmeans是一个很经典的聚类算法,我想大家都非常熟悉。虽然算法较为简单,在实际应用中却可以有不错的效果;其算法原理也决定了其比较容易实现并行化。 学习mahout就先从简单的km...
查看更多

分类算法之Decision Forest

算法 唐半张 发表了文章 • 0 个评论 • 290 次浏览 • 2015-10-06 11:11 • 来自相关话题

来做一些遥感图像自动解译的工作,需要根据遥感图像每个单元(像元,像素)的几个波段值和相互之间的位置关系来进行自动分类,也就是确定哪些区域是耕地,哪些是林地,哪些是草地。之前虽然有上过数据挖掘和机器学习的课,但是自己的专业并不在此,对遥感图像的自动分类更是一窍...
查看更多

利用Mahout实现在Hadoop上运行K-Means算法

mahout 唐半张 发表了文章 • 1 个评论 • 396 次浏览 • 2015-10-06 10:09 • 来自相关话题

一、介绍Mahout     Mahout是Apache下的开源机器学习软件包,目前实现的机器学习算法主要包含有 协同过滤/推荐引擎 , 聚类 和 分类 三个部分。Mahout从设计开始就旨在建立可扩展的机器学习软件包,用于处理大数据机器学习的问题,当你正...
查看更多

几种必须了解的分布式算法--一致性Hash算法

算法 唐半张 发表了文章 • 0 个评论 • 550 次浏览 • 2015-09-30 10:33 • 来自相关话题

一致性Hash算法 1)问题描述 分布式常常用Hash算法来分布数据,当数据节点不变化时是非常好的,但当数据节点有增加或减少时,由于需要调整Hash算法里的模,导致所有数据得重新按照新的模分布到各个节点中去。如果数据量庞大,这样的工作常常是很难完成的...
查看更多

几种必须了解的分布式算法---Paxos算法

算法 唐半张 发表了文章 • 1 个评论 • 520 次浏览 • 2015-09-30 10:32 • 来自相关话题

Paxos算法 1)问题描述 分布式中有这么一个疑难问题,客户端向一个分布式集群的服务端发出一系列更新数据的消息,由于分布式集群中的各个服务端节点是互为同步数据的,所以运行完客户端这系列消息指令后各服务端节点的数据应该是一致的,但由于网络或其他原...
查看更多

QuickStart kmeans 的脚本——Reuters

算法 唐半张 发表了文章 • 0 个评论 • 405 次浏览 • 2015-09-30 10:29 • 来自相关话题

鉴于在PPT上面,关于Reuters路透社的新闻使用kmeans的命令有残缺,导致我一头雾水。其实在mahout的examples文件夹里面已经有这个build-reuters.sh的脚本,大家直接运行就可以了。我这里附上官方版的直接运行脚本: #/** # ...
查看更多

面试经验分享之数据结构、算法题

算法 木舟 发表了文章 • 0 个评论 • 599 次浏览 • 2015-09-10 16:24 • 来自相关话题

  前言 面试 IT 企业的研发岗位,数据结构和算法显然是必考的项目。俺只学过普通的数据结构课程,没读过 STL,也没有过 ACM 的训练和比赛经历,在一开始面对这样类型题目的时候,心里还是十分忐忑的。大大小小几十场面试下来,自己在这方面总算有了一定的心得积...
查看更多

JavaScript删除数组重复元素的5个高效算法

算法 傲风寒 发表了文章 • 0 个评论 • 446 次浏览 • 2015-08-15 20:16 • 来自相关话题

之前一段时间一直在准备面试, 因而博客太久没更新; 现在基本知识点都复习完毕, 接下来就分享下 面试的一些常见问题: 去正规的互联网公司笔试、面试有很大的概率会碰到 使用javascript实现数组去重 的编码问题:如:魅族笔试题; 本博文就 js 如何实...
查看更多