加速 NLTK 数据包 (NLTK Data) 的下载速度的几种方法
NLTK 是一个在 Python 自然语言处理领域里非常流行的的一个包。NLTK 本身的安装比较简单 (如果是缺少编译环境的 Windows 系统, 推荐用 conda 安装 ),教程也比较多, 这里不再赘述。
然而要让 NLTK 真正工作起来,我们还需要去网上下载各种语料库、语法库和训练模型。由于网络原因 ...
Continue reading →NLTK 是一个在 Python 自然语言处理领域里非常流行的的一个包。NLTK 本身的安装比较简单 (如果是缺少编译环境的 Windows 系统, 推荐用 conda 安装 ),教程也比较多, 这里不再赘述。
然而要让 NLTK 真正工作起来,我们还需要去网上下载各种语料库、语法库和训练模型。由于网络原因 ...
Continue reading →最近几年,静态博客超越 wordpress。 在程序员社区, 利用 Github Pages 来托管静态博客更是风靡一时。 其中不少人也开始使用持续集成工具 Travis CI 来自动构建和发布博客。
本文介绍了一种使用持续集成工具 Travis CI 来实现自动化发布 Pelican 静态博客到 Github Page ...
Continue reading →Restful Service 早已不是什么新鲜玩意。 国内很多公司都提供基于 REST 的服务, 其中不少还有官方提供的 多语言 SDK。先不论这些 REST API 的设计, 那些SDK/REST Client 往往并不好用, 在 github 上也能找到大量改良的 fork。这里就分享一些我关于写好 REST Client 的愚见。
Continue reading →Travis CI 是一项面向 GitHub 用户的持续集成即测试服务。只要是在 GitHub 上开源的项目,经过简单配置, 便可以利用 Travis CI 来进行自动化测试。
做过 Python 开源项目开发的大概都曾被和特定 Python 版本相关的 bug 叮过 ...
Continue reading →PyPI 可以说是 Python 程序员几乎每天都要用到的工具 (当然由于众所周知的原因, 在国内使用豆瓣,阿里云 等公司/组织提供的 PyPI 镜像会更加快捷,稳定)。但是在每个公司内部都会有一些的闭源的,私有的 Python Package 。 为了让这些私有的 Python ...
Continue reading →