今天全无工作状态, 好在还有兄弟能聊聊天。 可能这几天太失败了, 自己定下的2018年计划, 就没有开一个好头~ 可能这几天家庭太累, 娃娃也不听话~ 可能这几天老婆的身体也不够好, 有一些不对劲的事情~ 可能这几天投资错失了一个极好的机会~ 可能这几天工作上相当不顺利, 前途渺茫的感觉~ 可能,以上都不是, 就是每个月都有那么几天莫名的悲伤。。。 这是一碗毒鸡汤,有谁想来一起喝点? 笑哭。。。 PS: 浮躁的我~

2018年01月08日 0条评论 6056点热度 2人点赞 阅读全文

论文链接: http://aclweb.org/anthology/D17-1312 这一篇论文, 主要想解决的问题是在一个新的领域, 当现有的语料不足够大的时候, 如何充分利用之前已经有的一些语料增强当前领域的词向量模型。 具体算法并不复杂, 不过感觉距离实用还是有一些距离: 首先需要原始语料,而不是原始语料训练出来的模型 因为需要得到一个词在原始语料的概率分布 还需要一个词同时在两个语料之中同时出现。 可是目前的情况是, 我们只有Google / Facebook / Stanford 等发布的大规模训练出来的…

2018年01月08日 0条评论 6291点热度 1人点赞 阅读全文

引言: 因为在工作之中接触到NER,并且可以有需要NER的地方。在此总结一些相关资料与自己的理解。 什么是命名实体识别 此段原文: http://blog.csdn.net/dvstream/article/details/17784293 命名实体识别(Named Entity Recognition, NER),又称作“专名识别”,主要任务是识别出文本中的人名、地名等专有名称和有意义的时间、日期等数量短语并加以归类。对很多文本挖掘任务来说,命名实体识别系统是重要的组成部分:一方面,命名实体识别可以帮助识别未登录…

2018年01月04日 0条评论 10387点热度 1人点赞 阅读全文

Introduction This simple bot is useful to help to download facebook videos on mobile phone. Biggest Advantage: No Privacy Leak Risk Facebook Page: https://www.facebook.com/XVideoHunter Messenger Link: http://m.me/XVideoHunter Too many apps, why need this? This…

2017年12月28日 0条评论 7470点热度 0人点赞 阅读全文

简介 这个小机器人的作用很简单, 帮你【在手机上】获取Facebook上面Video的下载链接。 重点: 【不会泄露隐私!】 已经很多人做啦,为什么还要再做一个? 目前这种方式还是比较新颖的。 Google Play/App Store 上面的手机App, 都需要你使用自己的账号登录他们的App。 他们的App会干神马事情,我是真的不知道~ 浏览器插件。 这种方式,插件还是能看到你的Facebook的一些隐私内容。手机上对插件支持比较好的, 貌似就是Firefox了。 第三方网站 这种方式挺好的, 但是只合适PC之…

2017年12月27日 0条评论 6881点热度 0人点赞 阅读全文

感觉这篇文章讲的有点道理, 就转发过来。做一些原文的简要概述吧~ 原文地址: https://weibo.com/ttarticle/p/show?id=2309404188259403040932&luicode=20000174&featurecode=20000320 什么是“中等收入陷阱” 几乎所有欠发达国家在发展到一定程度之后, 就会很诡异的出现发展停滞等等怪像。同时引发一系列的社会、经济问题。甚至跌回解放前~ 欠发达国家是如何发展起来的 文章认为, 主要是通过招商引资。 而且是引入发达国…

2017年12月23日 0条评论 8486点热度 0人点赞 阅读全文

荷兰航空 KLM Royal Dutch Airlines - 提醒客户飞机状态 点评: 感觉这个Bot还挺实用的。 Facebook针对航班还有特殊的消息模板。 看了一下, 自定义的地方也挺强的。 如果国内能访问的话, 其实可以改造成高铁的提醒。 Whole Foods Market - 智能食谱 Messenger链接: https://www.messenger.com/t/24922591487 开场白: 简单测试了一下: I love to eat some cake 点评: 感觉还是关键词匹配。我本身对…

2017年12月13日 0条评论 10285点热度 0人点赞 阅读全文

今天在V2EX上面看到一个哥们小站的数据库被人暴力破解, 并且把数据全删了。 在表示同情的同时,跟大家分享一下自己一个简单的小trick。 注意: 把数据库暴露到公网一定是非常危险的, 这个小trick只是将危险系数下降了一些而已! TL;DR 使用SSH转发, 将一个不知名的端口在内网转发到3306之上。具体命令: ssh -C -f -N -g ubuntu@127.0.0.1 -L 30221:127.0.0.1:3306 解释: 使用ssh端口映射的方式, 将本机的30221端口映射到3306端口。 这样,…

2017年12月08日 0条评论 9130点热度 3人点赞 阅读全文

之前在看Keras Example的时候, 发现对于NLP相关的任务使用的NN都非常浅。 没有很严谨的去数, 但是基本上都是一两层网路就结束了。 具体可以参考Keras Example 之中IMDB相关的代码。 当然, 效果也不差。 一直对这一块很奇怪。 偶然从知乎上面的一篇文章获得解答。 参考: 如何评价Word2Vec作者提出的fastText算法?深度学习是否在文本分类等简单任务上没有优势? 简要观点: 项亮: 文本分类基本还是个偏线性的问题。多层的网络相对单层的没有太多优势。但这不是说多层的没用,而是单层的…

2017年11月28日 0条评论 9341点热度 1人点赞 阅读全文

现在网上有一些预先训练好的Word2Vec模型, 比如Glove, Google-News以及我最喜欢的FastText,都有各自使用大数据训练出来的Word2Vec模型。 根据不同的业务, 也可以自己搜集语料库训练Word2Vec. 关于如何使用Keras加上预训练好的W2V模型, 具体可以参考官网教程:Using pre-trained word embeddings in a Keras model   篇幅比较长, 写得“太详细”了。 不过核心就在下面一行代码: (Example Code on …

2017年11月26日 0条评论 21521点热度 22人点赞 阅读全文
14567814