文本挖掘技术(04812052) 课程
在经过海绵式学习文本挖掘相关概念之后,很多概念和结构都是零碎的,依然没有办法组织在一起,而系统的学习是构建领域知识和提高领域知识最直接的办法,当然系统的学习,可以选择教材或者专业的书籍,抑或像我这样有幸能找到大学或者研究生课程,不过这都要感谢学校的开放,才让我这等没有上过研究生的编程人员有机会学习到这些高等课程。
下面的课程是“北京大学计算机科学技术研究所”的课程,我建议大家在学习的过程中进行扩展阅读,每个章节学习完成之后,查找相关概念和问题,进行扩展阅读,不但能加强对知识的理解和记忆,也能补充遗漏的知识点。
文本挖掘技术(04812052)
主讲: 杨建武 yangjw@pku.edu.cn
助教: 梁丰 liangfeng@pku.edu.cn
授课时间: 周四 18:40--21:30
授课地点: 三教 206
课程主页: [课程表](http://www.icst.pku.edu.cn/course/Mining/11-12Spring/index.html)
随着信息技术的发展,信息量爆炸性增长,其中80%是非结构化信息。如何对这些非结构化信息进行有效的分析处理成为学术界和工业界的研究热点。本课程是一门综合性的技术研究课程,涉及数据挖掘、信息检索和自然语言处理等研究领域。课程的学习有助于我院学生了解学术前沿,锻炼基础知识的综合应用能力,对于今后的学术研究或应用技术研发均具有重要意义。
详细课程安排及讲义下载见 课程表
目录如下:
-
第一章 引言 2012-02-16
-
第二章 文本特征提取技术 2012-03-01
-
第三章 文本检索技术 2012-03-15
-
第四章 文本自动分类技术 2012-03-22
-
第五章 文本自动聚类技术 2012-03-29
-
第六章 话题检测跟踪技术 2012-03-29
-
第七章 文本过滤技术 2012-04-19
-
第八章 关联分析技术 2012-05-03
-
第九章 文档自动摘要技术 2012-04-26
-
第十章 信息抽取技术 2012-04-26
-
第十一章 智能问答技术 2012-05-03
-
第十二章 文本情感分析技术 2012-05-17
-
第十三章 Ontology技术 2012-05-24
-
第十四章 半结构化文本挖掘方法
-
第十五章 文本挖掘工具与应用