NLP - FlyML

一直做智能客服这么久，也测试过很多其他家的智能客服。比如阿里小蜜，小i机器人，微软小冰等等。不过那都是抱着试试看的角度，有时候也想不起以前自己的实际使用场景，并没有尝试真正需要解决问题。这次正巧，在招行上面找在线客服的时候，就无意中体验了一把智能客服，而且感觉效果还不错。几个觉得做得不错的地方：首先我也担心是不是有客服在线，就问了是否有人，秒回一个“嗯嗯，在呢”。感觉像真人一样，其次，当我正在输入问题的时候，因为输入有一些时间，他等了一会就自动蹦出一个：您好，请详细说明您的问…

2018年09月05日 0条评论 5610点热度 0人点赞阅读全文

本次命题：数值预测上一篇文章我们的小题目是使用LSTM预测字符顺序的下一个字符。命题虽然简单，可是实际上应用范围也很广。比如输入法里面，就一定会用到相关的技术。只不过不一定是LSTM，肯定也不止一维特征。这次这个命题相对来说，比较实际一些：从历史预测监控数据预测即将来临的监控指标的数值。比如下图就是本站在友盟上面的监控数据。最右边的虚线部分就是友盟进行的预测的数值：本文代码特别鸣谢：https://blog.csdn.net/aliceyangxi1987/article/details/7…

2018年08月13日 1条评论 10433点热度 0人点赞阅读全文

LSTM 应该是这段时间应用非常广泛也非常火的一个算法了。关于其理论基础，已经有非常好的文章了。在这里，笔者记录一下自己从一些实际例子来学习LSTM的路程。不太监的话，应该会有好几篇文章。这是第一篇，主要目的：从一个简单的例子来看看LSTM是如何预测下一个输出的。从这个简单的例子，体会一下什么是Seg2Seg。大概看看，如何使用Keras来训练一个LSTM的模型。主要参考文章：在keras 上实践,通过keras例子来理解lstm循环神经网络 Understanding Stateful…

2018年08月12日 0条评论 10371点热度 2人点赞阅读全文

想解决的问题一个通用的模型, 希望能适用所有的日志. 比如常见的System Event Log. 尝试从这些大量的日志之中找到异常\不规则的地方主要架构分为3个模型: Log Key Anomaly Detection model 主要是根据生成的Log Key, 使用LSTM进行判断下一个Log Key是否是异常信息. 主要是使用了NLP的思想. 个人感觉这一块是DeepLog最有启发的一个模型. Workflows 主要是能识别出并行的日志. 但是具体怎么用, 没有(在Youtube视频上面)详细说明 …

2018年08月06日 2条评论 26652点热度 9人点赞阅读全文

论文标题: From Word Embeddings to Item Recommendation 论文地址: https://arxiv.org/pdf/1601.01356 核心思想这一篇论文的思想相比起其他的论文来说，思想非常简单，就是把Item 当成一句话之中的Word。使用训练Word2Vec模型的方法来训练一个Item2Vec 这种方法我还是比较认同的, 因为需要的数据比较简单, 是实际生产之中的应用场景会多不少. 训练数据论文之中提到的数据集太老了(2011年), 没找到. 因为论文之中提到的…

2018年03月05日 0条评论 13212点热度 0人点赞阅读全文

目前很火的芝士超人、百万英雄等等，已经有不少人做了答题辅助。比如： https://github.com/Skyexu/TopSup https://github.com/rrdssfgcs/wenda-helper 但是个人感觉，他们都缺少了最后一公里：需要人手工触发。我们目前做的这个事情，就是尝试把最后一公里简化，你只需要调用我们的API 或者基于我们的源码与模型，在本地搭建一个你自己的API，之后只需要不停的执行截图并调用API获取结果就可以了。项目地址：https://github.com/…

2018年01月22日 0条评论 6918点热度 0人点赞阅读全文

论文链接： http://aclweb.org/anthology/D17-1312 这一篇论文，主要想解决的问题是在一个新的领域，当现有的语料不足够大的时候，如何充分利用之前已经有的一些语料增强当前领域的词向量模型。具体算法并不复杂，不过感觉距离实用还是有一些距离：首先需要原始语料，而不是原始语料训练出来的模型因为需要得到一个词在原始语料的概率分布还需要一个词同时在两个语料之中同时出现。可是目前的情况是，我们只有Google / Facebook / Stanford 等发布的大规模训练出来的…

2018年01月08日 0条评论 6391点热度 1人点赞阅读全文

引言：因为在工作之中接触到NER，并且可以有需要NER的地方。在此总结一些相关资料与自己的理解。什么是命名实体识别此段原文： http://blog.csdn.net/dvstream/article/details/17784293 命名实体识别(Named Entity Recognition, NER)，又称作“专名识别”，主要任务是识别出文本中的人名、地名等专有名称和有意义的时间、日期等数量短语并加以归类。对很多文本挖掘任务来说，命名实体识别系统是重要的组成部分：一方面，命名实体识别可以帮助识别未登录…

2018年01月04日 0条评论 10507点热度 1人点赞阅读全文

荷兰航空 KLM Royal Dutch Airlines - 提醒客户飞机状态点评：感觉这个Bot还挺实用的。 Facebook针对航班还有特殊的消息模板。看了一下，自定义的地方也挺强的。如果国内能访问的话，其实可以改造成高铁的提醒。 Whole Foods Market - 智能食谱 Messenger链接： https://www.messenger.com/t/24922591487 开场白：简单测试了一下： I love to eat some cake 点评：感觉还是关键词匹配。我本身对…

2017年12月13日 0条评论 10391点热度 0人点赞阅读全文

之前在看Keras Example的时候，发现对于NLP相关的任务使用的NN都非常浅。没有很严谨的去数，但是基本上都是一两层网路就结束了。具体可以参考Keras Example 之中IMDB相关的代码。当然，效果也不差。一直对这一块很奇怪。偶然从知乎上面的一篇文章获得解答。参考：如何评价Word2Vec作者提出的fastText算法？深度学习是否在文本分类等简单任务上没有优势？简要观点：项亮：文本分类基本还是个偏线性的问题。多层的网络相对单层的没有太多优势。但这不是说多层的没用，而是单层的…

2017年11月28日 0条评论 9547点热度 1人点赞阅读全文

初次体验智能客服

[LSTM]使用LSTM预测监控数据的数值

[LSTM]初识大名鼎鼎的Seg2Seg模型: LSTM

[论文阅读]Deep Log 初步小结

[ReadNotes]使用Word2Vec的方式来训练Item2Vec

助你完成答题辅助的最后一公里

[ReadNotes]A Simple Regularization-based Algorithm for Learning Cross-Domain Word Embeddings

[DeepNLP] 初识命名实体识别

小调查：使用Facebook Messager Bot的实际例子

[DeepNLP] 为什么Keras之中NLP使用的都是浅层神经网络？