Mastering Natural Language Processing with Python阅读小记
书名:Mastering Natural Language Processing with Python 作者:Deepti Chopra,Nisheeth Joshi,Iti Mathur 出版社:Published by Packt Publishing Ltd. 出版时间:2016.06 ISBN:978-1-78398-904-1
作者都是Banasthali University的。
整体感觉,唉国外教材,它真的很像让什么都不会的我学会啊,真的非常适合自学。最主要是还有配套的线上代码块用于练习。只能说牛逼(但我没基础,唉)。
Python拥有大量的库和框架来支持,比较适合做自然语言处理。 文本分类、信息抽取、机器翻译、问答系统、摘要、情感计算、文本生成这些内容都涉及了。NLTK、spaCy、TextBlob、gensim、Stanford NLP、Hugging Face Transformers都有写,生怕我不会(我是真不会) 说起来前几天同侪聊到审查那边已经专业断档了,门外汉干技术活两眼一抹黑。 也能理解,缩短审查时间也是走极端了,干什么都讲究飞速,飞你个叮叮猫哦。
实际操作比较难理解的其实是情感分析、计算。比如文本分类里面有提到通过判断用户对于产品/服务态度的积极/消极特定识别垃圾邮件,难得理解了一部分。
Python生态系统和库在支持大模型方面确实有一些局限性。 Python有大量的库,提供高级接口来构建、训练和部署大模型。Hugging Face Transformers库特别适合处理基于Transformer架构的预训练模型,如BERT、GPT-3这些。 但是相对于编译型语言(啊,C++),Python在处理大规模数据集的时候执行效率上可能较低,关键部分代码转为C/C++的也比较多见。而且它对内存不友好,部署也太复杂了。
近期倒没怎么看到过这一类申请案例,也许大家都把目光转到大模型新场景应用上了吧(比较好吹一点)。