专栏名称: 数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
目录
51好读  ›  专栏  ›  数据皮皮侠

【最后一天】开学弯道超车!python常用科研方法都在这里了!

数据皮皮侠  · 公众号  ·  · 2024-08-30 10:00

正文

导言

本课程旨在帮助学员从 零基础快速掌握Python编程 ,特别是针对科研编程的应用。

课程中将结合 《管理世界》《中国工业经济》 等顶刊的案例,帮助学员理解技术的实际应用。同时,授课过程中将使用当今最前沿的 ChatGPT 作为辅助编程工具进行快速编辑。


1. 课程概览


课程名称: 面向人文社科的Python编程训练营: 从数据采集到机器学习


课程老师: Simon博士


课程时间: 2024年8月31日--9月28日


授课方式: 腾讯会议线上直播


报名方式:

扫码报名


1.1 课程目标: 通过本课程,学员将掌握 Python编程的核心技能 ,能够独立完成科研数据的处理与分析,为科研工作提供强有力的技术支持。


1.2 课程内容: 课程中将结合 《管理世界》《中国工业经济》 等顶刊的案例,帮助学员理解 技术的实际应用 。同时,授课过程中将使用当今最前沿的ChatGPT作为辅助编程工具进行快速编辑。


1.3 课程特点:

  • 易理解: 以社科学术实证需求为导向, 知识点力求通俗易懂

  • 可复制:提供所有代码块&案例数据

  • 长期回放:腾讯会议直播,录播上线“PPdata Academy”供长期查看(至少4月)

  • 全程答疑:答疑群+老师全程答疑


2. 课程案例


Case 1: 海关数据的处理与基础可视化

Case 2: 工商注册基本信息的处理与可视化

Case 3: 上市公司年报下载

Case 4: 中国土地市场网数据获取

Case 5: 企业人工智能指标构建

Case 6: 连锁董事网络指标测算

Case 7: 基于机器学习的数字专利分类

Case 8: 基于大语言模型的企业数字化转型指标构建


3. 课程大纲


第一讲:Python编程基础(8.31)

  • Python基础语法

    • 变量与数据类型

    • 运算符与表达式

  • 控制结构

    • 条件语句

    • 循环语句

  • 函数与模块

    • 函数定义与调用

    • 模块与包的使用

  • 文件操作

    • 文件读写

    • 文件路径与目录操作

  • 错误处理

    • 异常捕获与处理

    • 自定义异常

第二讲:数据分析与可视化基础(9.7)

  • Numpy

    • 数组与矩阵操作

    • 数学函数与统计方法

  • Pandas

    • 数据结构

    • 数据清洗与处理

    • 数据合并与分组

  • Matplotlib

    • 基本绘图

    • 图形定制与美化

    • 多子图与动画

Case 1:海关数据的处理与基础可视化

Case 2:工商注册基本信息的处理与可视化


第三讲:数据采集(9.15)

  • 发起网络请求

    • requests库的基本使用方式

  • 解析响应数据

    • Xpath

    • Beautifulsoup

    • Re

  • 抓包工具

  • 自动化爬虫

Case 1:上市公司年报下载

Case 2:中国土地市场网数据获取


第四讲:文本分析与社会网络分析基础(9.21)

  • 文本分析

    • Pdfplumber:PDF文档解析

    • Jieba:中文分词

    • TF-IDF:词频-逆文档频率

    • Word2Vec:词向量表示

    • LDA:最基础最传统的主题建模

    • BERT-Topic:基于BERT的主题建模

  • 社会网络分析

    • NetworkX:网络构建与分析

    • 基本网络指标

    • 社区检测与可视化

Case 1: 企业人工智能指标构建

Case 2:连锁董事网络指标测算


第五讲:机器学习(9.28)

  • 传统 机器学习

    • K-近邻算法(KNN)

    • 线性回归

    • 决策树

    • 支持向量机(SVM)

    • 聚类算法

  • 现代 机器学习

    • ERNIE: 最常用的中文 NLP 预训练模型

    • LangChain:自然语言处理中的链式结构模型

  • 深度学习 基础

    • 神经网络基础

    • 卷积神经网络(CNN)

    • 循环神经网络(RNN)

Case 1:基于机器学习的数字专利分类

Case 2:基于大语言模型的企业数字化转型测度


4. 课程报名


课程价格

早鸟价享六 五折







请到「今天看啥」查看全文