一晃就是一年

真的是时间飞逝,一晃就是一年.

上一篇更新还是在去年的8月18号,在过去的一年时间里,发生了很多事情,其中最大的好事就是大胖儿子出生了,给整个家庭带来了不少欢声笑语.

压力更大,我也需要更加努力了

google搜索常用十招

在今天,用户可以通过搜索引擎轻松找出自己想要的信息,但还是难以避免结果不尽如人意的情况。实际上,用户仅需掌握几个常用技巧即可轻松化解这种尴尬。下面介绍 10 个在进行 Google 搜索时可以使用的便捷技巧,其他搜索引擎也支持这 10 种技巧。

1、准确搜索

FuRXJh9_vhLBMVkw5ULCDbwRpdw

最简单、有效的准确搜索方式是在关键词上加上双引号,在这种情况下,搜索引擎只会反馈和关键词完全吻合的搜索结果。

比方说在搜索「Joe Bloggs」的时候,在没有给关键词加上双引号的情况,搜索引擎会显示所有分别和「Joe」以及「Bloggs」相关的信息,但这些显然并不是我们想要的结果。但在加上双引号后,搜索引擎则仅会在页面上反馈和「Joe Bloggs」相吻合的信息。

准确搜索在排除常见但相近度偏低的信息时非常有用,可以为用户省去再度对结果进行筛选的麻烦。

2、排除关键词

Fref2pKEQmNwJzNMLEGTRkB1ovj

如果在进行准确搜索时没有找到自己想要的结果,用户可以对包含特定词汇的信息进行排除,仅需使用减号即可。

例如在搜索「『Joe Bloggs』-jeans」时,你所得到的结果反馈是不包含「jeans」字眼的「Joe Bloggs」条目。

3、用「Either OR」(或)逻辑进行搜索

FuyZNczhVQyTAI9z8pwPuPtfKtc

在默认搜索下,搜索引擎会反馈所有和查询词汇相关的结果,但通过使用「OR」逻辑,你可以得到和两个关键词分别相关的结果,而不仅仅是和两个关键词都同时相关的结果。巧妙使用「OR」搜索可以让你在未能确定哪个关键词对于搜索结果起决定作用时依然可以确保搜索结果的准确性。

4、同义词搜索

FhgFtKnFXMR6mtcz654C_QgJ7nc

有时候对不太确切的关键词进行搜索反而会显得更加合适。在未能准确判断关键词的情况下,你可以通过同义词进行搜索。

如果你在搜索引擎输入「plumbing ~university」,你所得到的反馈结果会包含「plumbing universities」和「plumbing colleges」等相似条目。

5、在站内进行搜索

FuUg0lfj_PfqmftnFsbm_ZIag-k

绝大部分网站的搜索功能都有所欠缺,因此,更好的方法是通过 Google 等搜索引擎对站内的信息进行搜索。

你只需要在搜索引擎上输入「site:theguardian.com」加上关键词,搜索引擎就会反馈网站「theguardian.com」内和关键词相关的所有条目。如果再结合准确搜索功能,这项功能将会变得更加强大。

6、善用星号

FgK8ZrA_oUGD4eMk9cvZaJX3IAE

正如拼图游戏「Scrabble」的空白方块一样,在搜索引擎中,我们可以用星号填补关键词中的缺失部分,不论缺失的是一连串单词的其中一个还是一个单词的某一部分。此外,当你希望搜索一篇确定性偏低的文章时,也可以使用星号填补缺失部分。

例如,如果你在搜索引擎中输入「architect*」,你所得到的反馈结果将会是所有包含 architect、architectural、architecture、architected、architecting 以及其他所有以「architect」作为开头的词汇的条目。

7、在两个数值之间进行搜索

FkBMzmPhDLsFlRc0smLJO9_BEH4

在寻找问题的答案时,一个很好的方法是在一定范围内寻找和关键词相关的资讯。例如想要找出 1920 至 1950 年间的英国首相,直接在搜索引擎中输入「英国首相 1920.. 1950」即可得出想要的结果。

记住,数值之间的符号是两个英文句号加一个空格键。

8、在网页标题、链接和主体中搜索关键词

FqoIdkcflPJkWNhRq-OvGzvEYOS

有时你或许会遇上找出所有和关键词相关的所有网页标题、链接和网页主体的需求,在这个时候你需要使用的是限定词「inurl:」(供在 url 链接中搜索使用)、「intext:」(供在网页主体中搜索使用)以及「intitle:」(供在网页标题中搜索使用)。

例如,在搜索引擎中输入「intitle: 评测」会得到所有和关键词「评测」相关的网页标题。

9、搜索相关网站

Ft9PEXEuwsoF1yiYiUEqMH-vDm

相关的限定词可用于搜索相关网站时使用。例如,你仅需在搜索引擎中输入「related:theguardian.com」即可得到所有和「theguardian.com」相关的网站反馈结果。

10、搜索技能的组合使用

Fkt9mBNQWafTRnuE3yRbgOjKc5V

你可以对上述所有搜索技能进行组合运用,以便按照自己的意愿缩小或者扩展搜索范围。尽管有些技能或许并不常用,但准确搜索和站内搜索这些技能的使用范围还是相当广泛的。

随着 Google 等搜索引擎对于用户自然语言的理解程度与日俱增,这些搜索技能可以派上用场的情况或许将会变得越来越少,至少这是所有搜索引擎共同追求的目标。但是在当下,掌握这些搜索技能还是非常必要的。

牛逼的开源机器学习框架知多少

这篇文章是从36dsj转载过来的,写的很不错

 

449

机器学习毫无疑问是当今最热的话题,它已经渗透到生活的方方面面,在移动互联网中混不懂点机器学习都不好意思,说几个能看的到的,经常用邮箱吧,是不是感觉垃圾邮件比N年前变少了,无聊了和siri聊过天不,想坐一下无人驾驶汽车吗,手累了用脸解个锁,智能化产品推荐是不是让你更懒了。看不到的就更多了:信用卡欺诈监测保证你的交易安全,股票交易/量化投资(知道你的高收益理财怎么来的吗?),手势识别(用过海豚浏览器的手势吗),还有医学分析等等,巨头们为了在未来占领先机,前仆后继的开源他们的机器学习框架,加速了人类进入智能时代的步伐(说什么,机器人?)

Facebook:用于Torch的模块库fbcunn (2015-01-17 开源)

fbcunn可以替代Torch的默认模块,它们构建在Nvidia的cuFFT库(一个基于CUDA的库,用于深度神经网络)之上,可以在更短的时间内训练更大规模的神经网络模型,它对NVIDIA的GPU进行了优化。一部分可以用来训练大型计算机视觉系统。部分模块也可以用来训练处理不同类型数据的模型。既可以进行文本识别、图像识别,也能用于语言模型的训练。部分模块将大型卷积神经网络模型的训练速度提升了23.5倍。

fbcunn基于Fast Training of Convolutional Networks through FFTs这篇论文中的想法构建了这些模块,FAIR(Facebook人工智能实验室)的主任Yann LeCun是论文的合著者之一。与cuDNN相比,在卷积核较小的情况下(3×3),fbcunn的速度提升可达1.84倍;而在卷积核较大的情况下(5×5),速度提升可达23.5倍。

Torch和fbcunn的最早的用途之一:图片分类,它分类过ImageNet的120万张图片,可以参考这个地址:https://github.com/soumith/imagenet-multiGPU.torch

参考: >

https://github.com/torch/

https://github.com/facebook/fbcunn

https://research.facebook.com/blog/879898285375829/fair-open-sources-deep-learning-modules-for-torch/

微软:DMTK(2015-11-16 开源)

DMTK由参数服务器和客户端SDK两部分构成。参数服务器支持存储混合数据结构模型、接受并聚合工作节点服务器的数据模型更新、控制模型同步逻辑;客户端SDK负责维护节点模型缓存(与全局模型服务器同步)、本地训练和模型通讯之间的流水线控制以及片状调度大模型训练。它包含DMTK框架、LightLDA和分布式词向量(Word Embedding)三个组件。

DMTK采用了传统的客户端/服务器架构,有多个服务器实例运行在多台机器上负责维护全局模型参数,而训练例程(routines)则使用客户端API访问并更新这些参数。为了适应不同的集群环境,DMTK框架支持两种进程间的通信机制:MPI和ZMQ。应用程序端不需要修改任何代码就能够在这两种方式之间切换。DMTK支持Windows和Linux两种操作系统。

DMTK则是使用C++编写的,提供了一个客户端API和SDK。 DMTK的官网 对DMTK框架、LightLDA、分布式词向量的应用场景、下载、安装、配置、运行以及性能等方面都做了详尽的介绍(见参考部分)。

DMTK主要用于自然语言处理方面,比如:文本分类与聚类、话题识别以及情感分析等

参考:

http://www.dmtk.io

https://github.com/Microsoft/DMTK

Google:TensorFlow(2015-11-10 开源)

TensorFlow 是一个用来编写和执行机器学习算法的工具。计算在数据流图中完成,图中的节点进行数学运算,边界是在各个节点中交换的张量(Tensors–多维数组)。TensorFlow负责在不同的设备、内核以及线程上异步地执行代码,目前支持CNN、RNN和LSTM等图像、语音和自然语言处理(NLP)领域最流行的深度神经网络模型。

Google已将TensorFlow用于GMail(SmartReply)、搜索(RankBrain)、图片(生成图像分类模型–Inception Image Classification Model)、翻译器(字符识别)等产品。

TensorFlow能够在台式机、服务器或者移动设备的CPU和GPU上运行,也可以使用Docker容器部署到云环境中。在处理图像识别、语音识别和语言翻译等任务时,TensorFlow依赖于配备图像处理单元(GPU)的机器和被用于渲染游戏图像的芯片,它对这些芯片依赖度比想象中的高。当前开源的版本能够运行在单机上,暂不支持集群。操作系统方面,TensorFlow能够运行在Linux和MacOS上。

TensorFlow的核心是使用C++编写的,有完整的Python API和C++接口,同时还有一个基于C的客户端API。

参考:

https://www.tensorflow.org

https://github.com/tensorflow/tensorflow

IBM:SystemML (2015-06 开源)

SystemML是灵活的,可伸缩机器学习(ML) 语言,使用Java编写。可实现 可定制算法(述性分析、分类、聚类、回归、矩阵分解及生存分析等), 多个执行模式(单独运行、Hadoop 和 Spark ), 自动优化。它由 IBM 的 Almaden 实验室花了近 10年开发而成的机器学习技术。

SystemML语言,声明式机器学习 (DML)。SystemML 包含线性代数原语,统计功能和 ML 指定结构,可以更容易也更原生的表达 ML 算法。算法通过 R 类型或者 Python 类型的语法进行表达。DML 通过提供灵活的定制分析表达和独立于底层输入格式和物理数据表示的数据显著提升数据科学的生产力。

SystemML 运行环境支持 Windows、Linux 及 MacOS,可支持单机和分布式部署。单机部署显然有利于本地开发的工作,而分布式部署则可以真正发挥机器学习的威力,支持的框架包括 Hadoop 和 Spark

众所周知的IBM AIWaston融入了不少SystemML技术(不了解的同学可以看下《Jeopardy!》节目,来领教到沃森的威力)

参考:

http://systemml.apache.org

https://github.com/apache/incubator-systemml

三星:VELES

VELES 是分布式深度学习应用系统,号称:用户只需要提供参数,剩下的我来搞,VELES使用 Python 编写,使用OpenCL 或者 CUDA,利用基于Flow 的编程方式。

参考:

https://velesnet.ml

https://github.com/Samsung/veles

百度:期待ING。。。

巨头之所以开源自己耗时多年打造的机器学习框架,是希望能够加速在人工智能方面的部署,在人工智能日益重要的未来抢占更多的主导权。而对于机器人创业公司来说,当这么多巨头将机器学习平台开源后,还有什么理由做不好机器人。

End.

作为一个爱折腾的人,以后台式机千万不能再买

5月初刚回到国内,比较着急,也懒得自己去泡论坛调整搭配了。。随便在网上看了Dell的商务机,就跑去当地的电脑城去买了个Dell Optiplex 9020MT,花了小一万块钱,因为把内存升级到了32G,加了一个西数2TB的黑盘。。。在家加两个Dell 的U2414H

最近发现机箱突然之间发出巨大的声响.

虽然我对于硬件基础白痴。。。但是我还是打开了机箱。。。刚开始认为是机箱风扇的问题。。拔下来清晰干净后插上。。还是不行。。这个时候才把问题定位到电源风扇上面。。。

幸亏qq里面有各种硬件大神的帮助。。。nnd。。。dell 的商务机 optiplex 9020MT 的电源和主板都是dell 特殊定制的。。只有4针插CPU 和 8针插主板。。。而市面上卖的电源,基本都是24针插主板的。。也就是说,电源坏了只能去dell 售后才可以。。。

两个解决方案,一个是淘宝买个dell工厂流出来的电源,另外一个是自己把电源上的风扇给换掉。。。

现去淘宝买也来不及了。。。没有办法,就直接上手吧。。。给电源风扇清洗以后还是比较简单的。。

清洗完以后把机器在组装好了。。开机一看。。风扇也不响了。。。

 

 

回首2015,展望2016

2015 年还有一个多小时就要过去了.

2015 年,对我来说,是人生的一个巨大的转折,也是一个巨大的惊喜。

首先在四月底的时候决定了离开加拿大回到国内创业。回国了就是爽啊,干什么都是很方便,除了人与人之间的交际以及各种政府官僚主义和自大主义者让我有点不是很适应,自己也在不断的激励自己,活在哪个国家就要适应哪个国家的活法。按照中国古人的话来说,就是上得厅堂,下得厨房。

其次就是在9月20号,我结婚啦~ 2009 ~ 2015, 几年的跨国爱情,在任何人的眼里都是不可能的事情,在我们两个人的身上确发生了,就是这份爱情也值得我回来,让我继续努力呵护这份来之不易的爱情吧。

再次,就是学会了脸皮要厚,尤其实在国内各种流氓公司不要脸的情况下。在这里有点怀念加拿大的公司了。。。也许这就是国内的公司文化吧,要学会努力去适应并且学会反击。。。

2015年,说短也不短,说长也不长,自己的身上仍然提现着各种不足。养气的功夫仍然欠缺,需要在2016年好好的学习一下。

Cheers!

superbock

书桌终于搞定了。。

今年一直准备在家里办公。。当时着急就随便从宜家买了一个转角书桌,但是没有想到实在太小了。。

放下两个显示屏,书桌上就没有地方放东西了。。

书桌这东西也看了好久了,在天猫上,今天终于下定决心去买以前一直在犹豫的柏源乐芙的书桌,犹豫是因为他们家的产品要比其他家贵不少。。但是今天下定决心的原因是只有他家敢于真正的承认自己的产品是使用的E1 板材。。

感兴趣的同学可以去这里买:https://detail.tmall.com/item.htm?id=42960069654&spm=a1z09.2.0.0.etM6Nx&_u=i1kntjk7882

上张图吧

柏源乐芙

今天不舒服。。喝点酒试试

熟悉我的人应该都知道,我本人既不抽烟也不喝酒。。。

 

但是最近实在晚上睡眠不好。。。刚才又不知道怎么回事不太舒服。。。

看到饭桌旁边自己存的那一堆啤酒和白酒。。。。遂开了一瓶super bock。。。

以前觉得很苦的酒。。现在看来也就是那样了。。。

极路由装SS插件简单教程

今天给家里的两台极路由装上了SS插件,这下子就方便多了

这里简单记录下步骤,方便以后查阅:

 

  1. 开启极路由开发者模式。安装Shadowsocks插件需要开启开发者权限,如何开启请百度
  2. SSH登录极路由:ssh root@192.168.199.1 -p 1022 注意:使用root帐号连接路由,端口为1022,密码为后台登陆密码,如果你没有更改IP的话,IP是192.168.199.1
  3. 便捷脚本安装SS:cd /tmp && wget http://cdn.is26.com/file/hiwifi/shadow.sh && sh shadow.sh && rm shadow.sh
  4. 如果遇到失败可以重复上一步并将地址更换为:cd /tmp && curl -k -o ss.sh http://hiwifi-10014337.file.myqcloud.com/ss.sh && sh ss.sh && rm ss.sh 换个服务器换种速度和心情,如果你的第三部已经成功,那么请无视此步。
  5. 重新登录极路由的后台,高级设置里就能看到shadowsocks加速了,填写账号密码,选择智能模式,enjoy it!

下载:ss.tar

12个常用的社区开发者网站

新闻资讯类

Hacker News

Hacker News是一家关于计算机黑客和创业公司的社会化新闻网站,在该站,你可以实时看到编程界发生的新闻、新的学习资源、新的教程等等,也可以从从用户提交的数据中找到适合你的学习资源,学习者可以从这个网站找到更适合自己的新资源。

网址:https://news.ycombinator.com/news

DZone

与Hacker News相似,DZone也是一个类似IT新闻形式的编程社区,用户可以在网站内分享最新的IT新闻和编程资源,其文章质量由内容管理员来把关,所以不用过多的担心会有垃圾资讯。

网址:http://www.dzone.com/links/index.html

更多