好东西周报 2014-12-12

@好东西传送门 出品, 过刊见 http://haoweekly.memect.com

订阅: 发封邮件 hao@memect.com,标题是 " 订阅好东西周报 "



收录了过去一周@好东西传送门 发的 42 条微博。其中最受欢迎的有


2014-12-12 星期五 (7)

导航2014-12-112014-12-102014-12-092014-12-082014-12-072014-12-06

好东西传送门   2014-12-12 09:10
在今天的日报里我们引如了一个新特性:“求助”标签。在长版里有红色“求助”标签就是向社区寻求帮助的问题。今天有三个:@raogaoqi 问词性标注语料 http://t.cn/RzTbd8k @Wenjun-TM 问停用词生成工具 http://t.cn/RzTbd8e @王亚珅 问Indri中文教程http://t.cn/RzTbd8D 。求教于方家

 

好东西传送门   2014-12-12 08:45   转发: 17
机器学习日报 2014-12-11 http://t.cn/RzTUNuy 1.PyNLPIR汉语分词+zhon汉字常量 2. mafan中文处理 3. 空间大数据挖掘和可视化@ ICDM 4.《微软的LightLDA》讨论总结 5. Harvard的机器学习高级课程 加长版40条 http://t.cn/RzTUYUO 感谢 @城市数据派-UDParty @cswhjiang

 

好东西传送门   2014-12-12 06:38   转发: 82
边学边用word2vec和deep learning做NLP
phunter_lau   2014-12-12 06:07
Kaggle新比赛 ”When bag of words meets bags of popcorn“ aka ”边学边用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型,并在实际比赛里面比调参数和清数据。http://t.cn/RzTPJnm 如果已装过gensim不要忘升级。@好东西传送门

 

好东西传送门   2014-12-12 09:22   转发: 7
在今天的日报里我们引入了一个新特性:红色“求助”标签。在长版里有这个标签的就是向社区寻求帮助的问题。今天有三个:@raogaoqi 问词性标注语料 http://t.cn/RzTbd8k @Wenjun-TM 问停用词生成工具 http://t.cn/RzTbd8e @王亚珅 问Indri中文教程http://t.cn/RzTbd8D 。求教于方家

 

好东西传送门   2014-12-12 12:48   转发: 16
Python日报 2014-12-11 http://t.cn/RzTN0ZZ 1)Python-Socket网络编程 2)Python GPU计算工具 3)Statsmodels:Python的统计建模工具 4) Numba动态python编译器 5) SciPy and NumPy 加长版29条 http://t.cn/RzTNT7h 感谢 @麦嘉 @永不停息的恐龙哥 @Python开发者 @甜菜萧

 

好东西传送门   2014-12-12 10:23   转发: 4
YOCSEF学术年会特邀讲者和演讲题目:http://t.cn/Rzl0u05
土人谭晓生   2014-12-12 09:11
#CCF YOCSEF学术年会# 今年的大会主题是:大数据与智能交互(Big Data&Smart Interaction),邀请到陈宝权、余凯、胡宁、黄华、陶建华、@晓如微博 、胡清华、张卓、陈健等特邀讲者,预期会是一场从学界到产业界的思想碰撞 @中国计算机学会CCF @YOCSEF之声

 

好东西传送门   2014-12-12 09:26
扩散另一个问题 #求助#
王亚珅   2014-11-29 12:15
求助@52nlp @好东西传送门 @龙星镖局 @52cs @清华自然语言处理实验室 @我爱机器学习 @刘远超_哈工大_nlp @哈工大SCIR 做微博/短文本time-aware信息检索,除了TREC 2011/2013/2014 Microblog Track还有其他语料吗?TREC Tweets2011 dataset是通过http://t.cn/a1XUeK申请吗?后续爬取和使用,有啥教程么

 

2014-12-11 星期四 (8)

导航2014-12-122014-12-102014-12-092014-12-082014-12-072014-12-06

好东西传送门   2014-12-11 01:59   转发: 56
我整理了@老师木 发起的讨论《微软的LightLDA》 http://t.cn/Rzjy3ER 对这个话题贡献最多的还有 @eNe14 @帅小呆V @zhisbug @熊辰炎 @BigData大数据 等。也请参考老师木的另一条长微博《LightLDA 对 Big Data + Big Model的支持》http://t.cn/RzjUhPP

 

好东西传送门   2014-12-11 09:33   转发: 11
Python日报 2014-12-10 http://t.cn/Rzj01Mc 1.Dulwich纯Python实现的Git 2.Python开发注意事项 3.Flask子域名及通配符子域 4.MoviePy制作动画 5.RunSnakeRun可视化检查程序瓶颈 加长版23条 http://t.cn/Rzj0efg 感谢 @网路冷眼 @Python开发者 @me坤子 @SegmentFault

 

好东西传送门   2014-12-11 14:46   转发: 64
mafan的作者Thomas Roten还提供了两个很有用的工具 1)PyNLPIR提供了NLPIR/ICTCLAS汉语分词的Python接口 http://t.cn/RzYzUPP @ICTCLAS张华平博士 2)zhon提供了常用汉字常量,如CJK字符和偏旁,中文标点,拼音,和汉字正则表达式(如找到文本中的繁体字)http://t.cn/RzYzUPv

 

好东西传送门   2014-12-11 08:56   转发: 9
Web API 设计方法论
网路冷眼   2014-12-11 08:40
【Web API 设计方法论】http://t.cn/RzlBUB4 设计,实施和维护Web API就是一种挑战。本系列带领读者从确定API的业务案例到设计方法学,面临实现的挑战,以维持公共Web API的长效性做一个深度游。沿途采访有影响的人物,建议API阅读书目和相关主题。好文章!cc@2gua @伯乐头条 @好东西传送门

 

好东西传送门   2014-12-11 08:36   转发: 37
讽刺挖苦识别器
phunter_lau   2014-09-04 05:12
NLP和机器学习的胜利,Sheldon的问题彻底解决了,再也不用Sarcasm Sign了 http://t.cn/RhULwGq sarcasm detection!这里 http://t.cn/RhULwGG 讲解了他具体怎么做这个检测器

 

好东西传送门   2014-12-11 08:56   转发: 20
机器学习日报 2014-12-10 http://t.cn/RzjCiUc 1)免费电子书Lectures on Modern Convex Optimization 2)Weka的Python界面 3)基于Spark的社区发现 4)NIPS2014最佳论文之一关于大规模数据的非对称哈希算法 5)讽刺挖苦识别器 加长版57条 http://t.cn/RzjCXxj

 

好东西传送门   2014-12-11 14:37   转发: 123
http://t.cn/RzY7xwU mafan(“麻烦”)减少中文处理的麻烦。mafan是个中文处理的Python工具包,可以做繁简检测,繁简转化,检查中文标点,检查是否中英文混合,甚至还提供分词。两个作者一个是南非人和美国人,都贡献了很多中文处理开源项目http://t.cn/RzY7xwy http://t.cn/RzY7xw4

 

好东西传送门   2014-12-11 14:53   转发: 82
Running things on a GPU。用的是Cudamat and Theano. 文中总结了一堆Python/C++和深度学习有关的包
麦嘉   2014-12-11 12:30
分享一篇介绍Python GPU计算工具的文章 http://t.cn/8siCQFE

 

2014-12-10 星期三 (4)

导航2014-12-122014-12-112014-12-092014-12-082014-12-072014-12-06

好东西传送门   2014-12-10 13:18   转发: 20
精通Android触摸系统视频(中英字幕)
Ocean-藏心   2014-12-10 08:54
精通Android触摸系统(中英字幕) http://t.cn/RzWuVVR 历经3周的翻译,1小时18分钟的视频,终于完成了. 简介:http://t.cn/RzxZs6E的姊妹篇,详细讲解了Android自定义事件处理的方方面面。配合guolin 大神CSDN的博客和上一个视频,让你对开发Android 自定义控件游刃有余。@代码家 @googdev @Trinea

 

好东西传送门   2014-12-10 10:30   转发: 5
王海勋 漆桂林 赵世奇 王昊奋 邵斌 段楠 周明 李涓子 。豪华的全明星阵容!
中国计算机学会CCF   2014-12-09 19:04
【#CCFADL#55:《知识图谱前沿》开始报名】本期CCF学科前沿讲习班围绕知识图谱的构建及其应用中面临的挑战性问题,邀请到了相关领域的专家学者做主题报告,介绍知识图谱的基础理论、方法和应用,重点将对如何开展本领域前沿技术研究等进行探讨。报名详情:http://t.cn/RzOmUkD

 

好东西传送门   2014-12-10 09:28   转发: 16
机器学习日报 2014-12-09 http://t.cn/RzWBJoX 1)NIPS2014特邀报告Subgradient methods 2)《Neural Networks and Deep Learning》新出第五章 3)如何欺骗一个深度学习模型 4)NIPS深度学习研讨会的论文 5)不均匀正负样本分布下的机器学习 加长版48条 http://t.cn/RzWBSpM
好东西传送门 转发于 2014-12-10 09:30
感谢 @我爱机器学习 @陈天奇怪 @王威廉 NIPS开幕了。等闭会后传送门会整理大家的前线报道,不用担心会错过重要信息了!

 

好东西传送门   2014-12-10 11:52   转发: 21
Python日报 2014-12-09 http://t.cn/RzlZMjc 1)Python-goose:文章提取 2)python 的日志logging模块 3)Python异步IO的未来 4)常用的Python调试工具 5)C++ 逐渐 Python 化 加长版15条 http://t.cn/RzlZXkw 感谢 @麦嘉 @Python开发者 @phunter_lau @Linuxeden开源社区

 

2014-12-09 星期二 (7)

导航2014-12-122014-12-112014-12-102014-12-082014-12-072014-12-06

好东西传送门   2014-12-09 11:11   转发: 28
Python日报 2014-12-08 http://t.cn/RzOzQEb 1) Python书架:琳琅满目有关Python语言的书籍 2) Pystache:基于Python语言的Mustache 3) Task.py:快速并行 4) Python网络框架之scrapy 5) 十几个图像处理中常用的python包 加长版30条 http://t.cn/RzOznim
好东西传送门 转发于 2014-12-09 11:14
感谢 @网路冷眼 @Python开发者 @me坤子 @朝花夕拾录 最近Python日报的篇幅从15-20条上升到了30条左右。你喜欢这个篇幅增加吗?另外,Python日报也开始添加标签了

 

好东西传送门   2014-12-09 08:29   转发: 68
欢迎《大数据研究中心简报》!
super00011127   2014-12-08 16:46
大数据研究中心简报(第一期):学术进展部分 。 (1)预测传播概率与传播规模;(2)从官僚主义到平等主义:揭示鸽子群集运动的复杂策略;(3)大数据帮助你寻找感兴趣的地点;(4)距离 vs复杂性:大数据帮你导航;(5)实时大规模数据流的新分类算法;(6)图片和视频之间的跨界语义索引;等等 http://t.cn/RzpDP1P

 

好东西传送门   2014-12-09 09:20   转发: 35
机器学习日报 2014-12-08 http://t.cn/Rz0dnsv 1)Mikolov用简单的模型应用Word2Vec 2)牛顿法与拟牛顿法学习笔记 3)用Watson做可视分析 4)Jeff Dean CIKM演讲幻灯片:大规模深度学习 5)LightLDA 对 Big Data + Big Model的支持 加长版49条 http://t.cn/Rz0d3Xb
好东西传送门 转发于 2014-12-09 09:20
感谢 @网路冷眼 @浙大可视分析小组 @丕子 @许家铭_CASIA @老师木

 

好东西传送门   2014-12-09 11:17   转发: 7
IBM Worklight移动开发平台的教程。Worklight(现在改名MobileFirst)介绍 http://t.cn/RzOZMIa http://t.cn/RzOZMIS
晓风well   2014-12-03 09:46
根据Worklight官方文档编写的简易版Worklight tutorial @IBM中国大学合作部 ,涉及客户端、服务器端、第三方REST API调用,希望能够帮助到正在学习worklight的同学们。 http://t.cn/Rz6JKsj

 

好东西传送门   2014-12-09 06:21   转发: 131
《不均匀正负样本分布下的机器学习》汇总了@机器学习那些事儿 发起的讨论,一共选了39 条精选讨论(选自165条原始评论和转发)贡献最多的有 @特级飞行员舒克@昊奋@离家出走的托尔斯泰@范涛_中科大@cswhjiang http://t.cn/Rz0QAtH
好东西传送门 转发于 2014-12-09 06:28
对这个话题贡献较多的还有 @睡眼惺忪的小叶先森 @宋云涛 @小飞鱼_露 @思奇吞象 @孙明明_SmarterChina @phunter_lau

 

好东西传送门   2014-12-09 15:57   转发: 16
好东西周报2014-12-05 过去一周最受欢迎的分享有: 纪念王珏老师 (172) 解释机器学习、数据挖掘、模式识别和统计学习的区别 (124) Data Science in Python (85) nature toolbox,nature的科学工具集 (84)《Flask Web开发》和《图解HTTP》 (75) 感谢编辑 @卓勇霖-北萱堂 http://t.cn/RzOCf65

 

好东西传送门   2014-12-09 17:27   转发: 190
@i木木丶 求推荐几个好的国外ml的博客 。答:Bernhard Pfahringer总结过一个知名机器学习博客的列表http://t.cn/RvtHsyZ ,有CrossValidated, KDnuggets等大站,也有众多个人博客如Alex Smola。 Quora上有一个更新的列表 http://t.cn/zjQ4sRx 看这些基本应该够了

 

2014-12-08 星期一 (4)

导航2014-12-122014-12-112014-12-102014-12-092014-12-072014-12-06

好东西传送门   2014-12-08 23:33   转发: 23
Flask教程:Miguel Grinberg最近不仅出版了Flask Web Development book这本大家期待已久的Flask书,还推出了两个视频“An Introduction to Flask”和“Building Web APIs with Flask”,官网上各有一章基础免费视频 http://t.cn/RzXgKof

 

好东西传送门   2014-12-08 09:47   转发: 10
Python日报 2014-12-07 http://t.cn/RzpcEfS 1)防DDoS脚本 in python 2)Ipython Notebook inside an IDE 3)再谈Python的GIL 4)Python 3技巧:对切片命名 5)python 用动画 来 表达 数据 加长版38条 http://t.cn/RzpcuVv
好东西传送门 转发于 2014-12-08 09:48
感谢 @智博是小叮当 @禅phk @Zooooooooo_痴迷个蛋TS @hustfans @IT技术博客大学习

 

好东西传送门   2014-12-08 01:15   转发: 29
机器学习日报 2014-12-07 http://t.cn/RzNB95H 1)度量学习归纳与总结 2)NeuralTalk:从图像生成自然语言的Python工具 3)遗传算法和产生式艺术 4)Python语言的统计数据分析简介 5)《随机森林:从理论到实践》 加长版44条 http://t.cn/RzNBCQN 感谢 @网路冷眼 @eNe14 @统计之都

 

好东西传送门   2014-12-08 19:56   转发: 47
Python书架
网路冷眼   2014-12-08 10:47
【Python书架:有免费的电子书可下!】http://t.cn/RzpwU9f 本网站汇集了琳琅满目有关Python语言的书籍,有收费的,也有免费的。Python英文版的书籍基本上收齐,要想淘Python书籍,在本站就够了 @2gua @伯乐头条 @Python发烧友 @好东西传送门 @Linux中国

 

2014-12-07 星期日 (5)

导航2014-12-122014-12-112014-12-102014-12-092014-12-082014-12-06

好东西传送门   2014-12-07 22:00   转发: 2
http://t.cn/RzNOTFK Key Thinkers on Space and Place 新概念”空间科学家”
UT军张   2014-11-23 02:03
地理对于地理学者可以是截然不同的东西。或可归为两类。对某些人,地理就是距离,这些人大都是空间科学家(spatial scientist)。对另些人,地理就是背景(context)。不光是地方性的背景,而且是多层嵌套、多地互动、可以在时间点上捕捉又在时间轨道上演进的背景。这些人是空间思考者(spatial thinker)。

 

好东西传送门   2014-12-07 13:48   转发: 26
函数式编程导论
网路冷眼   2014-12-07 13:47
【函数式编程导论:写给非函数式程序员教程】http://t.cn/RzCFmg9 许多函数式编程文章教授的是抽象的函数式技巧:组合,管道和高阶函数.而本文另辟蹊径,举列说明了每天用命令式,非函数式编写代码的程序员如何将程序翻译为真正的函数式风格.强烈推荐!@2gua @孢子响马 @伯乐头条 @好东西传送门 @CSDN_CODE

 

好东西传送门   2014-12-07 13:04   转发: 337
NeuralTalk是一个Python的从图像生成自然语言描述的工具。它实现了Google (Vinyals等,卷积神经网络CNN + 长短期记忆LSTM) 和斯坦福 (Karpathy and Fei-Fei, CNN + 递归神经网络RNN)的算法。NeuralTalk自带了一个训练好的动物模型,你可以拿狮子大象的照片来试试看 [威武] http://t.cn/RzCDELy

 

好东西传送门   2014-12-07 08:49   转发: 34
机器学习日报 2014-12-06 http://t.cn/RzClK1I 1)im2col基于caffe的图像处理 2)参加kaggle竞赛是怎样一种体验? 3)简明深度学习方法概述(二) 4)写给程序员的R语言笔记 5)Richard Socher参与创建MetaMind 加长版36条 http://t.cn/RzClC2i
好东西传送门 转发于 2014-12-07 08:52
感谢 @网路冷眼 @神一手golden @王威廉 @赵开勇 @winsty 今天加了一个新功能:大多数微博都被加了标签,有主题标签如“视觉”“自然语言处理”,有内容类型标签如“代码”“书籍”“论文”“幻灯片”,也有分类信息标签如“会议”“问答”。欢迎大家提意见

 

好东西传送门   2014-12-07 10:10   转发: 23
Python日报 2014-12-06 http://t.cn/RzC8IV0 1)Python 3技巧:分解序列 2)Wikipedia:获取Wikipedia网站 3)用Python的 __slots__ 节省9G内存 4)Awesome Python免费资源集合 5)Python并行任务技巧 加长版21条 http://t.cn/RzC8xPN
好东西传送门 转发于 2014-12-07 10:10
感谢 @Python开发者 @顺水如萍 @LoCCS-Andy @Geek快报

 

2014-12-06 星期六 (6)

导航2014-12-122014-12-112014-12-102014-12-092014-12-082014-12-07

好东西传送门   2014-12-06 01:21   转发: 24
《Python之IDE和开发工具收集》
me坤子   2014-12-05 09:27
【原创整理】Python之IDE和开发工具收集 http://t.cn/RzoXJNJ

 

好东西传送门   2014-12-06 23:28   转发: 22
[置顶] 我们的《机器学习日报》网址是ml.memect.com http://t.cn/R7ZepFz 《Python日报》网址是py.memect.com http://t.cn/R7UjD75 邮件订阅方法是给 hao@memect.com 发封邮件,标题是" 订阅机器学习 "或" 订阅Python "即可

 

好东西传送门   2014-12-06 01:42   转发: 62
汇总了@王威廉 发起的讨论:《关于深度学习和重整化群的讨论》 HTML版http://t.cn/RzKR4bC @phunter_lau @鲁东东胖 @南大周志华 @追风的骨骺 长微博 http://t.cn/RzKRzLl

 

好东西传送门   2014-12-06 23:52   转发: 48
现代分布式系统简明教程
网路冷眼   2014-12-06 09:24
【现代分布式系统简明教程】对于像Amazon的Dynamo, Google的BigTable和MapReduce, Apache的Hadoop这样的现代分布式系统,很少有资料把背后的本质贯穿来讲。http://t.cn/z8Q84uW 尝试把这些系统所涉及的术语、概念、理论和协议、算法以及所解决问题的命题进行了归纳总结。值得收藏!@2gua@伯乐头条

 

好东西传送门   2014-12-06 06:11   转发: 83
机器学习日报 2014-12-05 http://t.cn/RzKQ4yU 1)LightLDA:大规模LDA模型 2)图像转文本:Toronto大学深度学习演示 3)深度学习与重整化群 4)Eric Xing关于深度学习的思考 5)RML读书会:变分推断,平均场 加长版41条 http://t.cn/RzKevJP

 

好东西传送门   2014-12-06 01:28   转发: 24
Python日报 2014-12-05 http://t.cn/RzK8ohW 1)D3py:基于D3的Python绘图库 2)树莓派+Python+pyserial 2.7实现串口通信 3)机器学习经典算法Python实现AdaBoost 4)Data Science in Python 5)Python 有哪些新手不会了解的深入细节? 加长版22条 http://t.cn/RzK8KLT

 

有新评论的更早的微博 (1)

好东西传送门   2014-12-03 13:50   转发: 8
最近每天的长微博从原来的图片版切换为新浪文字版长微博,不知道大家更喜欢哪一种?文字版的例子 http://t.cn/Rz61muL 图片版的例子 http://t.cn/Rz61cDW 投票地址 http://t.cn/Rz63FQm
好东西传送门 转发于 2014-12-06 01:37
最终结果:31投票,27人投给了文字版,4人投给了图片版。我们会继续用文字版发长微博,同时也会根据图片版爱好者的意见调整版式。谢谢大家参与反馈!