好东西周报 2015-01-25

@好东西传送门 出品, 过刊见 http://haoweekly.memect.com

订阅: 发封邮件 hao@memect.com,标题是 " 订阅好东西周报 "



收录了过去一周@好东西传送门 发的 66 条微博。其中最受欢迎的有


2015-01-25 星期日 (10)

导航2015-01-242015-01-232015-01-222015-01-212015-01-202015-01-19

好东西传送门   原微博 2015-01-25 11:08   转发: 10
Python日报 2015-01-24 http://t.cn/RZ8Q1Sl 1) Uliweb现在支持IPython notebook 2) Vim的Python编辑器详细配置过程 3) 入门:学习Python循环 4) 另一个Lambda表达式教程 5) scikit-learn系列视频免翻墙版 可点击加长版20条 http://t.cn/RZ8QrRc

好东西传送门   原微博 2015-01-25 11:48   转发: 9
Web技术日报 2015-01-24 http://t.cn/RZ8EBcD 1) 简单配置服务端代理Tengine 2) Netflix用node.js做A/B测试的经验 3) 线程有什么用处? (看点在评论) 4) OpenResty增强resty 命令行工具和wss协议支持 5) HTML 5前端性能优化指南 可点击加长版31条 http://t.cn/RZ8EgeB
好东西传送门 原微博 转发于2015-01-25 11:48
感谢 @soulteary @agentzh @CNodeJS @EchoJS_News @优秀网页设计

好东西传送门   原微博 2015-01-25 06:51   转发: 26
总结大家的答案。@子元是个变态 @南山盖盖 推荐用HDP(dirichlet precess)不用预先确定topic数,gensim有实现 http://t.cn/RZ8SOwJ @eastseek 说看每个主题内部的凝聚力,不建议乱选一个固定数字。@唐杰THU 说Sqrt(#doc)
西瓜大丸子汤   2015-01-23 18:23
topic modeling里topic的数量,大家一般都是怎么选的呢?

好东西传送门   原微博 2015-01-25 02:59
传送问题
聪Hit   2015-01-24 22:27
谁有ACE2005年Chinese语料啊?@好东西传送门 @梁斌penny @刘知远THU

好东西传送门   原微博 2015-01-25 17:33   转发: 20
大数据日报 2015-01-24 http://t.cn/RZRL2Bq 1) 讲给硅谷创业者的大数据精华集合 2) 可扩展性的代价 3) Spark Summit East 2015的议程 4) 数据科学网络资源的超全列表 5) 宜信大数据实时授信平台 可点击加长版44条 http://t.cn/RZRLyx0
好东西传送门 原微博 转发于2015-01-25 17:33
感谢 @登州知府 @爱可可-爱生活 @CrazyJvm @数盟社区 @投融资解决方案
好东西传送门 原微博 转发于2015-01-25 18:10  回复 @王瑞珩 “回复@好东西传送门:里面有一个加...”
回复@王瑞珩: 因为新浪长微博就是没有外部链接的。在微博正文上有长版的可点击链接

好东西传送门   原微博 2015-01-25 03:55   转发: 15
日报里已经提过了,这里再扩散一次 //@王帅强JYU:迄今为止,收到一堆印度和巴基斯坦童鞋的申请。国内的童鞋只有一个,但很遗憾才硕士一年级,而芬兰这边规定比较死,必须最迟夏天拿到硕士学位才可以。哎,国内的童鞋们,期待你们的加盟!
王帅强JYU   2015-01-21 22:22
本人在芬兰于韦斯屈莱大学(University of Jyväskylä)招收博士1-2名,免学费,生活补助为每月1700-2000欧,欢迎对推荐系统、信息检索、数据挖掘等方向感兴趣的同学报名申请。申请地址http://t.cn/RZYA3V7,截止日期为3月31日。个人主页参见http://t.cn/RZYA3Vz @丕子 @大山坡的春 @黄萱菁 @刘铁岩

好东西传送门   原微博 2015-01-25 11:35   转发: 18
为今天的讨论《大数据不是堆机器》做个脚注 http://t.cn/RZ8SfjI @hjk41 @陈天奇怪 @文光围脖 @anch3or
登州知府   2015-01-24 10:11
这篇文章讨论了scalability的代价,结论是有时可扩展的计算框架,如Spark,性能表现还不如设计良好算法的单线程: http://t.cn/RZNyJ4x 我觉得从长远看,简单粗暴算法的可扩展架构会战胜精巧算法的单线程。而且,性能损失在可接受范围内,原因也不是scalability引起的吧。

好东西传送门   原微博 2015-01-25 08:45   转发: 22
机器学习日报 2015-01-24 http://t.cn/RZ8NRVZ 1) O’Reilly机器学习系列图书推荐 2) PowerGraph 3) PCA脸的应用及Demo 4) 讨论:大数据不应该就是堆机器 5) 深度学习进阶线路图 可点击加长版44条 http://t.cn/RZ8NEnb

好东西传送门   原微博 2015-01-25 06:42   转发: 31
《大数据不是堆机器》http://t.cn/RZ8SfjI @hjk41 发起的讨论:distributed system done wrong 正方观点:分布式系统应该先努力把单机性能优化好,否则就会陷入 单机性能不好-堆机器-通讯压力变大-堆更多机器 的怪圈。反方观点@康桥语冰 :用分布式计算工具的目标不是变快,而是scalable。你怎么看?

好东西传送门   原微博 2015-01-25 16:45   转发: 189
@破破的桥 问:有没有知识图谱方面较好的书籍、论文或代码实现? 以前也有类似的问题@孙明明_SmarterChina@昊奋 都做过综述 。知识图谱研讨会办过两届,有很多好的PPT。在我们的微博主页搜“知识图谱”也有很多。长微博 http://t.cn/RZRZrOg 有外链版 http://t.cn/RZRwUy0
好东西传送门 原微博 转发于2015-01-25 17:02  回复 @任远AI “知识图谱是各大搜索引擎的核心业...”
右边说的是实话。@昊奋 好象也在写
好东西传送门 原微博 转发于2015-01-25 17:07  回复 @任远AI “知识图谱是各大搜索引擎的核心业...”
David Wood有一本《Linked Data》 http://t.cn/R7kosLQ Tom Heath和Christian Bizer也有一本 http://t.cn/z0gmSpU 可以算是介绍知识图谱的前身,很多基础技术都有讲
好东西传送门 原微博 转发于2015-01-25 17:31  回复 @Copper_PKU “这个资源还可以 NIST TAC Knowle...”
谢谢增补。请大家继续!明天传送门会做合集。

2015-01-24 星期六 (8)

导航2015-01-252015-01-232015-01-222015-01-212015-01-202015-01-19

好东西传送门   原微博 2015-01-24 08:26   转发: 19
机器学习日报 2015-01-23 http://t.cn/RZQGke2 1) Facebook广告点击预测模型 2) Naive-Deep Face Recognition 3) 人工智能也出现“刷分”乱象 4) jetpack在Docker里方便地安装和配置机器学习工具 5) 国际语义网会议ISWC 2014的视频 可点击加长版67条 http://t.cn/RZQqv32
好东西传送门 原微博 转发于2015-01-24 08:30
感谢 @PingWest品玩 @一起读论文 @爱可可-爱生活 @波多野丽猪 @FacePlusPlus 今天一个专题是如何看待人工智能中标准测试集的作用?旷视科技展示了一个很简单的模型就在LFW人脸识别上达到99.5% 欢迎大家发表自己的意见 http://t.cn/RZQqGlK http://t.cn/RZQqGlS

好东西传送门   原微博 2015-01-24 10:58
值得关注
w3c中国   2015-01-23 13:20
W3C将于2月5日在北京举办 Web支付标准技术研讨会,向中国区会员及支付行业代表汇报W3C Web Payment标准计划的最新进展及未来规划,并诚邀相关各方(浏览器及软件厂商、信用卡服务提供商、银行、有关监管部门、第三方支付服务提供商、电商、大型零售商、电信运营商等)参与讨论。http://t.cn/RZHGgD4

好东西传送门   原微博 2015-01-24 11:38   转发: 9
Web技术日报 2015-01-23 http://t.cn/RZQaIza 1) 双11——淘宝的下一代架构的成人礼 2) 大搜车的前端架构是怎样的? 3) 中国首届CSS开发者大会的总结 4) Toolkit:比Bootstrap更多实用UI组件的前端框架 5) THREE.JS源码注释 可点击加长版40条 http://t.cn/RZQaMWv

好东西传送门   原微博 2015-01-24 10:33   转发: 17
神总结
实验楼官方微博   2015-01-23 23:10
[最右]用一句话总结了HTML,CSS,JS的关系。HTML是名词,JS是动词,CSS是形容词和副词。

好东西传送门   原微博 2015-01-24 06:24   转发: 3
传送门也没做过,要请教这方面的专家。一个设想:也许可以用dependency parser,被动形式应该有nsubjpass关系,主动形式是nsubj关系。不过这只能处理动词。对你说的短语不知道怎么做。
波多野丽猪   2015-01-24 06:11
想问有没有什么工具可以判断出短语与其被动形式的区别?举个例子,has father和is father of就是两个相反地指向,a has father b = b is father of a。总之想要的是输入has father和is father of,能告诉我他们两个是相反的。。@好东西传送门

好东西传送门   原微博 2015-01-24 09:21   转发: 18
Python日报 2015-01-23 http://t.cn/RZQcqWi 1) Dpark源码剖析 2) 使用Selenium Python API与元素交互 3) Python 在 Linux 系统运维中都有哪些应用? 4) Medusa: 基于Google Dart虚拟机的超快Python实现版本 5) python编程速查表 可点击加长版36条 http://t.cn/RZQc5pm
好东西传送门 原微博 转发于2015-01-24 12:21
感谢 @fiona514 @网路冷眼 @python自动化测试 @爱可可-爱生活 @sumnous_t

好东西传送门   原微博 2015-01-24 18:03   转发: 10
大数据日报 2015-01-23 (测试) http://t.cn/RZQr641 1) 2015年1月数据库引擎排行榜 2) 中国Hadoop技术峰会2015北京站 1月24日议程 3) 数据科学Python自学系列 4) 争鸣:大数据智能分析外滩踩踏事故背后 5) Docker Swarm简介 可点击加长版38条 http://t.cn/RZQraCQ

好东西传送门   原微博 2015-01-24 10:51   转发: 14
[鼓掌] 赞@一起读论文 和右边 //@AOzil: 推.希望能把这个事情做好.
一起读论文   2015-01-23 18:26
#一起读论文#@AOzil 点评 Practical Lessons from Predicting Clicks on Ads at FacebookADKDD好文:Facebook广告点击预测模型。他们提出先用Gradient Boosting Regression Tree......http://t.cn/RZjenAv

2015-01-23 星期五 (10)

导航2015-01-252015-01-242015-01-222015-01-212015-01-202015-01-19

好东西传送门   原微博 2015-01-23 10:52   转发: 41
这个窝窝团的互联网系统经验分享是真干货,实战总结,互联网老兵出品。
郑昀   2015-01-23 10:21
方案集锦:1鹰眼,http://t.cn/RzTFtz8;2推荐评测,http://t.cn/RzTF56A;3业务降级,http://t.cn/RzTFtyQ;4Notify,http://t.cn/RzHv3RO;5搜索筛选排序http://t.cn/RzHyZ7Z;6即席查询和集群调度http://t.cn/RzgqfPT;7定时任务调度和管理http://t.cn/RZzO7AW;8监控,http://t.cn/RZTsluz

好东西传送门   原微博 2015-01-23 06:38   转发: 40
《争鸣:大数据智能分析外滩踩踏事故背后》微软中国和百度都在外滩踩踏事故后发表了大数据分析结果。昨天@杨静lillian 发表了综合文章,给出百度地图热力图和人流移动方向,探讨实时预警的可能性。规划界和计算机界人士就此展开了讨论。传送门选择了27条意见汇总在此 http://t.cn/RZTnYbc
好东西传送门 原微博 转发于2015-01-23 06:40
参与这个话题讨论的专家主要有 @AUPer @留小抄 @殷冬明 @tiantianyeah @开放数据中国 @刘瑜_北大GISer @wepon_清华同衡 @慧思慧想 @spacemanyang @小沙家浜帮主 @haishan_wu @郑宇MSRA

好东西传送门   原微博 2015-01-23 01:09   转发: 14
国际语义网会议的视频发布了
波多野丽猪   2015-01-22 22:50
@好东西传送门 ISWC2014视频发布了(缺tutorials部分),http://t.cn/RZTCUja,推荐下Google Raghavan的keynotes,另外@程龚_NJU @昊奋 你们的视频出来了!

好东西传送门   原微博 2015-01-23 13:09   转发: 3
好会,好话题,好地方(Slovenia海边度假胜地,就在威尼斯对面),好时间(6月)——和NIPS的举办时间地点比就是天堂了 [嘻嘻]
程龚_NJU   2015-01-23 12:46
我们在ESWC上将举办一个关于语义数据的排序/摘要/呈现/浏览的workshop,名叫SumPre 2015,征稿CFP请点击 http://t.cn/RZH4GeH,workshop的网站是http://t.cn/RZH4GeQ,欢迎大家踊跃投稿,优秀论文将推荐到IJSWIS(SCI期刊,CCF-C类)

好东西传送门   原微博 2015-01-23 06:06   转发: 49
机器学习日报 2015-01-22 http://t.cn/RZTE3RC 1) 美团推荐算法实践 2) 深度学习用于问答系统答案句的选取 3) 卷积神经网络用于搜索用户意图识别 4) 机器人几何数学暑期学校 5) Awesome系列中的公开数据集 可点击加长版66条 http://t.cn/RZTE1Mb
好东西传送门 原微博 转发于2015-01-23 12:10
感谢 @十月伤感wb @ComplexLY @爱可可-爱生活 @cvnote计算机视觉笔记

好东西传送门   原微博 2015-01-23 09:07   转发: 38
今天的Github头条:前端面试题 Front-end Job Interview Questions http://t.cn/RZyntjc 12000颗星啊!

好东西传送门   原微博 2015-01-23 10:17   转发: 23
和Dropbox的Pyston竞争的产品来了 http://t.cn/RZTsfTK
网路冷眼   2015-01-23 09:01
【Medusa: 基于Google Dart虚拟机的超快Python实现版本】http://t.cn/RZTWvDB 据称Medusa比CPython快10~15倍。对CPython不满意的童鞋应该关注。GitHub地址:http://t.cn/RZTW4mR cc@2gua @伯乐头条 @Linux中国 @百度技术沙龙 @好东西传送门 @CSDN_CODE

好东西传送门   原微博 2015-01-23 06:14   转发: 7
传送一个v2ex上的问题:验证码二值化最佳阀值的选取。关于去噪点,二值化取阀值,有什么好的算法以及学习的途径?我现在知道的有迭代,大津这些算法,但实际应用中算法应该有所调整吧,思路应该是? 参考scikit-imagehttp://t.cn/RZTnP3C

好东西传送门   原微博 2015-01-23 07:09   转发: 19
Python日报 2015-01-22 http://t.cn/RZTm0x7 1) 专为Python打造LLVM 2) Python 3.4 中新的 asyncio 3) 地图上模拟疫情扩散 4) Python可视化工具概述 5) 文件读入utf8的一个坑 可点击加长版17条 http://t.cn/RZTmOTQ
好东西传送门 原微博 转发于2015-01-23 12:45
感谢 @爱可可-爱生活 @HackerNewsDaily @me坤子 @Python开发者 @老师木

好东西传送门   原微博 2015-01-23 09:31   转发: 2
Web技术日报 2015-01-22 http://t.cn/RZTeN9u 1) 开发无框架单页面应用 2) CSS 工作流 3) 站在电商平台上的互联网金融系统架构实践 4) 多方位解析PHP vs Node.js之争 5) 最有趣的HTML/JS/DOM/CSS小花招 可点击加长版39条 http://t.cn/RZTe0SS

2015-01-22 星期四 (10)

导航2015-01-252015-01-242015-01-232015-01-212015-01-202015-01-19

好东西传送门   原微博 2015-01-22 10:57   转发: 7
坚持阅读机器学习日报,月薪涨一万不是梦 [嘻嘻]
云适配   2015-01-22 10:51
#程序猿漫谈#填空:______月薪过万??小编先来,用Amaze UI月薪过万不是梦!![耶][doge] http://t.cn/RPLxnV1

好东西传送门   原微博 2015-01-22 09:21   转发: 5
Web技术日报 2015-01-21 http://t.cn/RZY02EF 1) Handlebars创建语义化前端模板 2) HTML head 头标签 3) W3C成立Trust & Permissions Community Group 4) 开放数据晴雨表2014年报告 5) 浅谈WEB页面提速 可点击加长版39条 http://t.cn/RZY04DD
好东西传送门 原微博 转发于2015-01-22 14:12
感谢 @前端大全 @吴伟1st @开放数据中国 @慕课网前端学习小组 传送门尤其推荐大家去看一下开放数据晴雨表 http://t.cn/RZY0N9k 开放数据是下一代Web的重要基础设施,意义不亚于知识图谱

好东西传送门   原微博 2015-01-22 07:31   转发: 19
机器学习日报 2015-01-21 http://t.cn/RZYSNyw 1) 用MeCab打造一套实用的中文分词系统 2) 讨论:饶毅:AI暂时还是伪智能 3) Mining a VC:文本分析风险投资家关注什么 4) 一些关键词提取的工具 5) Rabit:兔子和分布式机器学习 可点击加长版48条 http://t.cn/RZYSpcz
好东西传送门 原微博 转发于2015-01-22 11:16
感谢 @陈天奇怪 @爱可可-爱生活 @52nlp @36氪

好东西传送门   原微博 2015-01-22 08:23   转发: 69
Python日报 2015-01-21 http://t.cn/RZY9tWN 1) GitHub 上排行前400的 Python 开源项目 2) @廖雪峰 的《Python教程》 3) PhantomjsFetcher抓取渲染JS后的网页 4) 11 个可能不为人知的Python函数库 5) 用python实现外币投资组合优化 可点击加长版20条 http://t.cn/RZY9ckY
好东西传送门 原微博 转发于2015-01-22 12:19
感谢 @网路冷眼 @SegmentFault @laiyonghao @爱可可-爱生活 @开源小组

好东西传送门   原微博 2015-01-22 08:16   转发: 38
推荐。作者把pyspider当中实现Phantomjs代理的部分拆了出来,独立成一个小的爬虫模块PhantomjsFetcher @网路冷眼 前两天刚介绍过pyspider http://t.cn/RZOewsk 这篇是个很好的实战汇报
SegmentFault   2015-01-21 16:57
【#Python#利用#Phantomjs#抓取渲染JS后的网页】,分享自 @SegmentFault ,文章传送门:http://t.cn/RZW6OPh

好东西传送门   原微博 2015-01-22 12:34   转发: 20
这个好东西还没有转过?顶起来!
ComplexLY   2014-12-11 10:58
Awesome系列中的公开数据集Awesome Public Datasets:http://t.cn/Rz2wunu

好东西传送门   原微博 2015-01-22 11:39   转发: 6
上次是@phdxie 主讲的,这个星期又有讲座了(陈锋,IBM)。支持技术交流活动!希望各地的交流活动越来越多
御剑_上海大数据爱好者   2015-01-20 17:09
大数据上海【第二期】主题:《图存储和图计算的应用与算法分析》,1.25日下午两点,张江高科华强科技大厦不见不散。 http://t.cn/RZl2svi

好东西传送门   原微博 2015-01-22 15:40   转发: 5
给还没有订阅日报的新老粉丝:现在传送门有四个日报:机器学习日报http://t.cn/R7ZepFz Python日报http://t.cn/R7UjD75 Web技术日报http://t.cn/RZP4Mmt 大数据日报http://t.cn/RZGaWBF 订阅方法都是给hao@memect.com发信,标题是订阅xx日报。在各日报的主页上有更详细的订阅方法,和RSS订阅地址

好东西传送门   原微博 2015-01-22 11:49
@phdxie 解应春 博士上次报告的照片
御剑_上海大数据爱好者   2015-01-19 10:17
首次沙龙圆满结束,感谢解博的精彩演讲,受益良多,现场交流气氛热烈,很多人都找到了同行志趣相投的朋友,非常高兴!期待@phdxie 更多分享交流。第二期老地方华强科技大厦,时间定在25日下午14:00,活动预告随后发出,欢迎大家关注和参加!

好东西传送门   原微博 2015-01-22 08:07   转发: 33
推荐试试zhon http://t.cn/RZYK6I3 里面有中文标点常量
harvvey   2015-01-21 19:56
下午使用python 处理中文中的punctuation,花费了2h,研究各种办法,从速度上,还有去除效果上,参考了这篇文章,http://t.cn/RZje3po 效果不令人满意,在即将放弃的时候,使用awk,简单的一句 awk '{ gsub(/[[:punct:]]/, "", $0);print $0}' 效果很好。

2015-01-21 星期三 (9)

导航2015-01-252015-01-242015-01-232015-01-222015-01-202015-01-19

好东西传送门   原微博 2015-01-21 13:34   转发: 37
都是好东西,我们都在用 :D 再补充一个blessed http://t.cn/RZjKiwh 彩色打印必备
网路冷眼   2015-01-21 12:57
【11 个可能不为人知的Python函数库】http://t.cn/RZldgqo 本文专门锁定那些不为人知的Python库,就是Python老手也应当看看,也许有一两个还真从未见过[doge]@2gua 还不get?@Linux中国 @百度技术沙龙 @好东西传送门 @伯乐头条

好东西传送门   原微博 2015-01-21 12:19   转发: 4
这个没有固定的打法。我们内部有一套打分机制,一方面是reputation,比如不搞一线工作的大V分数比较低,一线工程师根据发言记录比较高。另一方面是按内容关键词,过于基础或过于冷门的问题都得分低。again,这需要不少领域知识,还有对样本的统计。//@52nlp: 这就是一个好问题,大家有建议没?
龙之白云   2015-01-21 11:28
请问现在从纯文本角度出发有无方法可以识别出高质量问题和无意义问题,目前考虑区分有回答的和新发布,有回答的按机器学习日报的想法是不是匹配相关主题就算好问题呢?那如果没有回答的新问题只用分类的话可以么,特征不知该作何选择?求指教~@52nlp @好东西传送门

好东西传送门   原微博 2015-01-21 05:13   转发: 194
一些关键词提取的工具rake http://t.cn/RZldsTw KEA http://t.cn/RZlgvof maui-indexer http://t.cn/RZlgvgO 中文分词工具也有关键词提取,例如jieba http://t.cn/zlfOaMU Yaha http://t.cn/R7AQyPt 另外原则上各种主题模型工具都可以改造来用。进阶阅读Quora贴 http://t.cn/zOw3h2N
好东西传送门 原微博 转发于2015-01-21 07:50
Carrot2也常被提到,不过感觉不是很好用,更多是聚类 http://t.cn/RZjP3Wu Mallet http://t.cn/RZjP3W3 Stanford TMT http://t.cn/RZjP3Wm , Gensim 都需要自己训练,不能开箱即用。另外传送门感觉统计方法对小样本效果不好,还是要辅以规则和知识才实用

好东西传送门   原微博 2015-01-21 07:30   转发: 2
Web技术日报 2015-01-20 http://t.cn/RZlBVav 1) HeroKu’s HTTP API设计指南 2) CSS3动画 3) 函数式 CSS 4) W3C Web封装标准工作草案 5) 纯CSS图标 可点击加长版39条 http://t.cn/RZjv0UV
好东西传送门 原微博 转发于2015-01-21 11:38
感谢 @WebReBuild @w3c中国 @江南白衣Calvin @前端开发博客 @IT技术博客大学习

好东西传送门   原微博 2015-01-21 12:26   转发: 3
右边说的这些方法我们都实验过,都有价值。//@knighterzjy: 最近在做这样的问题,难点在于优质的定义。从信息论,信息检索,实体识别,数据统计和业务本身分别都可以给出一些特征。另外textrank的迭代思路也可以考虑。 //@52nlp:这就是一个好问题,大家有建议没?
龙之白云   2015-01-21 11:28
请问现在从纯文本角度出发有无方法可以识别出高质量问题和无意义问题,目前考虑区分有回答的和新发布,有回答的按机器学习日报的想法是不是匹配相关主题就算好问题呢?那如果没有回答的新问题只用分类的话可以么,特征不知该作何选择?求指教~@52nlp @好东西传送门

好东西传送门   原微博 2015-01-21 12:23
另外,判断一句话是不是一个问题本身就不太容易,光看有没有问号是不够的,还有很多语气和句法的判断。这个机器目前能做到95%,想做到99%还需要更大的努力。
龙之白云   2015-01-21 11:28
请问现在从纯文本角度出发有无方法可以识别出高质量问题和无意义问题,目前考虑区分有回答的和新发布,有回答的按机器学习日报的想法是不是匹配相关主题就算好问题呢?那如果没有回答的新问题只用分类的话可以么,特征不知该作何选择?求指教~@52nlp @好东西传送门

好东西传送门   原微博 2015-01-21 04:41   转发: 28
Python日报 2015-01-20 http://t.cn/RZldy2V 1) 用 C++ 来学习 Python 2) Python 对象的序列化 3) python和OpenCV做测距摄像头 4) Python Object Graphs 5) 在Python中正确使用Unicode 可点击加长版20条 http://t.cn/RZldUPK
好东西传送门 原微博 转发于2015-01-21 04:41
感谢 @火丁笔记 @Python开发者 @爱可可-爱生活 @SegmentFault @Geek快报

好东西传送门   原微博 2015-01-21 12:29   转发: 2
回复@杨洋magicyang: 这个很难说,点击数和转发数和问题本身是不是好问题关系不大,主要和主题有关。深度学习就是比逻辑得到的关注多。只能在同一个主题内比较才有意义。 //@杨洋magicyang:有没有考虑根据积累下的转发评论等反馈对历史数据提取一下特征
龙之白云   2015-01-21 11:28
请问现在从纯文本角度出发有无方法可以识别出高质量问题和无意义问题,目前考虑区分有回答的和新发布,有回答的按机器学习日报的想法是不是匹配相关主题就算好问题呢?那如果没有回答的新问题只用分类的话可以么,特征不知该作何选择?求指教~@52nlp @好东西传送门

好东西传送门   原微博 2015-01-21 06:51   转发: 40
机器学习日报 2015-01-20 http://t.cn/RZluQfW 1) 信息几何学及其在机器学习中的应用 2) CIPS青工委 “自然语言处理与深度学习”报告会 PPT 3) 法律分析 4) 讨论:判别模型和生成模型 5) Rich Feature Hierarchies for Visual Tracking 可点击加长版57条 http://t.cn/RZlFove
好东西传送门 原微博 转发于2015-01-21 09:10
感谢 @CIPS青工委 @爱可可-爱生活 @岩间花树GT @winsty

2015-01-20 星期二 (8)

导航2015-01-252015-01-242015-01-232015-01-222015-01-212015-01-19

好东西传送门   原微博 2015-01-20 16:01   转发: 16
赞。也欢迎其他人更多的经验分享,传送门会整理归档 //@52nlp: 法无定法吧,这个和你的实际任务还是有关,我更多的时候发现判别模型更有效一些。关于生成模型和判别模型,推荐 Manning 的这个PPT,讲得非常不错 Maxent Models and Discriminative Estimation http://t.cn/RZWdX6J
岩间花树GT   2015-01-20 12:19
各位大神能简单解释下什么时候用判别模型?什么时候用生成模型?他们之间的trade off是什么?@好东西传送门 @52nlp @张栋_机器学习 @我爱机器学习 @梁斌penny @老师木

好东西传送门   原微博 2015-01-20 11:22   转发: 39
向这十款开源项目致敬 Echarts,Cocos2d-x,pomelo,SeaJS,Tengine,Amaze UI,fastjson,Kissy,DPark,Mars
云适配   2015-01-19 18:20
盘点时刻到!!2014 年10款Github上最火爆的「国产」开源项目正式出炉!感谢Github,让程序猿们有了一个优秀的共享平台,享受思想碰撞、参与优秀项目的激情。github精选 @GitHub家园 @GitHub那些事儿 @GitHub排行榜 好东西不能私藏,快用起来!![来]http://t.cn/RZOWm4f

好东西传送门   原微博 2015-01-20 07:17   转发: 34
机器学习日报 2015-01-19 http://t.cn/RZWIJjt 1) 竞价搜索广告中的点击率预估法 2) 过去半年团队Spark Meetup分享的总结 3) 廖君的机器学习和深度学习资料总结 4) ICLR 2015稿件合集 5) 《Introduction to Information Retrieval》 可点击加长版74条 http://t.cn/RZWI6qb
好东西传送门 原微博 转发于2015-01-20 07:17
感谢 @爱可可-爱生活 @iB37 @明风Andy @廖君_Jun @王威廉

好东西传送门   原微博 2015-01-20 13:40   转发: 9
@好东西传送门的 第四个日报“大数据日报”本周即将开始发送。欢迎大家前去预约 http://t.cn/RZGaWBF ——我们希望这个日报成为有趣的日报,只传送那些有趣的人(好吧,其实是说工程师)讲的真正有趣的事。Hardcore,不像附图里那样的

好东西传送门   原微博 2015-01-20 15:25   转发: 1
本周另一件事是日报的搜索就要开始beta测试了。这是个很多人要求的功能。以后再也不用担心找不到、忘掉你在日报里看到过的内容了。空口无凭,以图为证。想被邀请做beta tester的请点这里 http://t.cn/RZlvWNa

好东西传送门   原微博 2015-01-20 09:34   转发: 13
Python日报 2015-01-19 http://t.cn/RZWKafu 1) Python迭代器 2) 《计算的本质:深入剖析程序和计算机》Python版代码 3) Python科学(数学)编程讲义 4) PEDA: Pyhon GDB漏洞调试助手 5) 使用gettext模块翻译Python3源码以支持国际化 可点击加长版17条 http://t.cn/RZWKoO1
好东西传送门 原微博 转发于2015-01-20 09:34
感谢 @Python开发者 @爱可可-爱生活 @SegmentFault @Jioun_dai @图灵社区

好东西传送门   原微博 2015-01-20 12:41   转发: 18
简单的描述可以参考@8383luhttp://t.cn/zlvbCxe 也可参考《文本上的算法》第三章 by 路彦雄 @yanxionglu http://t.cn/8kfgzCS
岩间花树GT   2015-01-20 12:19
各位大神能简单解释下什么时候用判别模型?什么时候用生成模型?他们之间的trade off是什么?@好东西传送门 @52nlp @张栋_机器学习 @我爱机器学习 @梁斌penny @老师木

好东西传送门   原微博 2015-01-20 07:58   转发: 6
Web技术日报 2015-01-19 http://t.cn/RZWxdX8 1) Node.js和io.js性能比较 2) Chrome开发者工具之JavaScript内存分析 3) 从Google Wave和XML看软件复杂性之争 4) CSS3 Transform 5) Express.io搞定实时通信 可点击加长版33条 http://t.cn/RZWxkXu
好东西传送门 原微博 转发于2015-01-20 07:58
感谢 @前端大全 @前端乱炖 @HackerNewsDaily @开源小组 @外刊IT评论

2015-01-19 星期一 (11)

导航2015-01-252015-01-242015-01-232015-01-222015-01-212015-01-20

好东西传送门   原微博 2015-01-19 08:22   转发: 15
综合答案 @搞笑人士:通过jni 有个库叫jblas 已经挺稳定了。它应该自带了netlib的blas binary,换成intel的就行。 @故乡的茶干: ujmp的可视化很不错,jblas可以通过jni调用native库。 全部讨论合集《java的矩阵计算包》http://t.cn/RZ0rZYk
挖机一号仓前造   2015-01-18 15:18
你好。请问java里面有没有比较好的矩阵计算包呢?因为要做矩阵的逆运算.当我的矩阵大时 jama跑不动。@好东西传送门 @左耳朵耗子

好东西传送门   原微博 2015-01-19 13:50   转发: 12
从容器和Kubernetes技术看现代云计算的发展轨迹
DockerOne   2015-01-19 08:27
【从容器和Kubernetes技术看现代云计算的发展轨迹】本文通过对容器技术和kubernetes的大致介绍,阐述了容器技术的优势以及Google对于容器技术的理解。基于单台服务器的容器虚拟化技术可以为测试和部署提供方便,但是在生产环境中,客户往往面对的是整个集群的资源。http://t.cn/RZCkf2A

好东西传送门   原微博 2015-01-19 08:27   转发: 19
回复@HelloSpirit: 感谢推荐。该课的主页是http://t.cn/RvlpOkq 第7课是VC Dimension //@HelloSpirit:Caltech的learning from data课程的前几章,有讲解有例子,易于理解。 //@好东西传送门:求大家推荐! //@挖机一号仓前造: 求这方面的paper。
学生You   2015-01-18 10:36
@好东西传送门 请问,关于vc-dimension 比较好的文章有哪些,能够帮助更好的深入理解?谢谢

好东西传送门   原微博 2015-01-19 11:06   转发: 13
机器学习周报 2015-01-17 今天邮件发送了第一期机器学习周报测试版。在线版在这里 http://t.cn/RZOZzzM
好东西传送门 原微博 转发于2015-01-19 15:19
Python周报 http://t.cn/RZO6aur Web技术周报 http://t.cn/RZO6aud 也发送了。

好东西传送门   原微博 2015-01-19 14:43   转发: 7
这篇知乎的文章总计得挺好 http://t.cn/RZOxNM5
水木年华eric   2015-01-18 16:23
【前端工程师应该对 HTTP 了解到什么程度?从哪些途径去熟悉更好?】@豪情:其实我到感觉前端应该了解从http发起请求,到dns到ap… http://t.cn/RZpzB6V (分享自 @知乎 安卓客户端)

好东西传送门   原微博 2015-01-19 14:23   转发: 8
Python日报 2015-01-18 http://t.cn/RZOImJI 1) 如何用python做数据挖掘 2) pyserial:用Python操作串口 3) Profiling Python Scripts 4) 字符串符号化(Tokenization)处理 5) 什么阻止了Python获得Javascript V8那样的速度? 可点击加长版11条 http://t.cn/RZOI1Pf

好东西传送门   原微博 2015-01-19 08:47   转发: 47
解释生动有趣!
数说工作室网站   2015-01-18 21:03
【分类战车SVM】第五话:核函数(哦,这实在太神奇了!)→ http://t.cn/RZ0JICY

好东西传送门   原微博 2015-01-19 13:49   转发: 21
@廖君_Jun (ty4z2008 at github)新分享的资料整理,原文是Github版,想fork和增补都很方便。
廖君_Jun   2015-01-19 12:20
机器学习(Machine Learning)&深入学习(Deep Learning)资料总结 http://t.cn/RPYBqAZ @我爱机器学习 @好东西传送门 @张栋_机器学习

好东西传送门   原微博 2015-01-19 08:10   转发: 22
求大家推荐!//@挖机一号仓前造: 求这方面的paper。
学生You   2015-01-18 10:36
@好东西传送门 请问,关于vc-dimension 比较好的文章有哪些,能够帮助更好的深入理解?谢谢

好东西传送门   原微博 2015-01-19 15:09   转发: 8
Web技术日报 2015-01-18 http://t.cn/RZOiOpI 1) ES6 generator函数与co再一瞥 2) 前端工程师应该对 HTTP 了解到什么程度? 3) JavaScript编写的可定制性最强的XSS过滤模块 4) 常用的CSS属性列表汇总 5) PySpider强大的网络爬虫系统 可点击加长版28条 http://t.cn/RZOilyp
好东西传送门 原微博 转发于2015-01-19 15:09
感谢 @网路冷眼 @刘骥-JimLiu @程序员老雷 @慕课网 @水木年华eric

好东西传送门   原微博 2015-01-19 10:12   转发: 19
机器学习日报 2015-01-18 http://t.cn/RZOvIyS 1) @Rachel____Zhang 讲逻辑回归 2) 分类战车SVM第五话核函数 3) visionworkbench NASA开发的通用图像处理工具库 4) The Unreasonable Effectiveness of Deep Learning 5) 推荐系统的坑 可点击加长版74条 http://t.cn/RZOviDa
好东西传送门 原微博 转发于2015-01-19 10:13
感谢 @研究者July @王小科科科 @爱可可-爱生活 @cvnote计算机视觉笔记 @数说工作室网站