Skip to content

Commit

Permalink
proof lesson 1 & 2
Browse files Browse the repository at this point in the history
  • Loading branch information
hcp4715 committed Apr 4, 2023
1 parent 7ab4b03 commit 84a4fe6
Show file tree
Hide file tree
Showing 2 changed files with 57 additions and 58 deletions.
14 changes: 7 additions & 7 deletions bookdown_files/Books/Book/1001-lesson1.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -14,35 +14,35 @@ pdf.options(height=10/2.54, width=10/2.54, family="GB1") # 注意:此设置要

****

第一节课的主要目的在于帮助大家初步了解本课程,并为本课程做好心理准备。所以接下来,我们主要介绍为什么要开设这门课程、课程的内容是什么、需要做什么样的准备、以及能收获什么。
本次课的主要目的在于帮助大家了解本课程的基本情况,为本课程做好心理准备。所以接下来,我们主要介绍为什么要开设这门课程、课程的内容是什么、需要做什么样的准备、以及能收获什么。


## R在心理科学及社会科学中的运用

### 数据科学 {#1-data-science}

开设这门课有其时代的大背景。作为在心理学院讲授的课程,我们将本课称为《R语言在心理学研究当中的应用》。但实际上,R语言是当前数据科学(data science)中主流的计算机语言之一。 正是数据科学在各种学科中的渗透和普及,让我们开设这门课程成显得非常重要。那么什么是data science呢?
这门课的开设有其时代的大背景。作为在心理学院的课程,我们将这门课称为《R语言在心理学研究当中的应用》。但实际上,R语言是当前数据科学(data science)中主流的计算机语言之一。 正是数据科学在各种学科中的渗透和普及,让我们开设这门课程成显得非常重要。那么什么是data science呢?

**数据科学是什么**

在科学研究中有人认为,科学的革命是经过了几次范式转换的([参考链接](https://www.perfcloud.cn/blog/post/81))。最早期的是"实验"科学,我们通过做实验,一个一个地去验证假设。随后是理论科学,在实验基础上进行归纳。随着计算机越来越发达,我们进入了"计算"时代,通过用各种计算模型模拟的方法,帮助我们去理解世界。但是现在,随着数据越来越多,通过数据驱动的方式就能发现很多新的东西。最近这些年,很多在科技领域尤其是在计算机领域取得的重大突破和进展都是依赖于大量数据的,也就是通过对数据进行“提炼”从而得到新的发现。比方说最近非常火的ChatGPT。作为现在全球最火的科技界产品之一,它背后的模型叫做LLM,Large Language Model。这里说的Large language就是一个大语言模型,它依靠的就是大量语言材料的训练。
在科学研究中有人认为,科学的革命是经过了几次范式转换的([参考链接](https://www.perfcloud.cn/blog/post/81))。最早期的是"实验"科学,研究者通过设计和完成实验,一个一个地去检验假设。随后是理论科学,在实验基础上进行归纳。随着计算机越来越发达,我们进入了"计算"时代,通过用各种计算模型模拟的方法,帮助我们去理解世界。但是现在,随着数据越来越多,通过数据驱动的方式就能发现很多新的东西。最近这些年,很多在科技领域尤其是在计算机领域取得的重大突破和进展都是依赖于大量数据的,也就是通过对数据进行“提炼”从而得到新的发现。比如说最近(2023年初)非常火的ChatGPT。作为现在全球最火的科技界产品之一,它背后的模型叫做LLM,Large Language Model。这里说的Large language就是一个大语言模型,它依靠的就是大量语言材料的训练。

**数据科学的内容**

大概10多年前,数据科学就已经出现。大家也许对“数据科学”这个术语已经不再陌生。数据科学里面既涉及到计算机编程,也包括数理统计。当讨论具体应用领域的数据科学,比如心理学的科研领域,数据科学也需要domain-specific 的知识,也就是这个领域的特殊性知识。

大概10多年前,数据科学就已经出现。这两年大家应该对“数据科学”已经不再陌生。数据科学里面既涉及到计算机编程,也包括数理统计。当讨论具体应用领域的数据科学,比如心理学的科研领域,数据科学也需要domain-specific 的知识,也就是这个领域的特殊性知识。
[此处可以插入关于数据科学的Venn图]

这意味着什么?意味着如果你仅仅懂计算机,那你不一定能懂data science的;如果你仅仅是懂数学和统计,那也不意味这你能解决一个data science的问题。必须要将计算、统计和领域特殊的知识进行结合。在心理学研究中,这对研究生提出一个新的要求。


### 数据科学的诞生------数字化时代 {#1-data-science-born}

为什么会有data
science?其实大家应该能感受到,随着我们电脑的普及,互联网越来越发达,我们产生的数据实际上产生了爆炸式的增长。这里有一个可视化的例子。我们可以看到,在计算机出现之前人类产生的数据是非常少的,而计算机出现之后产生的数据越来越多。
为什么会有data science?大家应该能直观地感受到:随着个人电脑的普及,互联网越来越发达,整个社会所产生的数据呈现爆炸式的增长。下图是一个可视化的例子。我们可以看到,在计算机出现之前人类产生的数据是非常少的,而计算机出现之后产生的数据越来越多。

![](1001-lesson1/image-20230302194802453.png)

我们也有了越来越先进的仪器,它们所观察到的、产生的数据也是非常大的。去年的这个图片相信很多人在朋友圈都被刷屏过。这是人类所能观察到的一个划时代的新的图像,尽管我们可能不知道它具体的内涵是什么,但是都知道它很酷。
我们也有了越来越多的个人电子设置以及其他的先进设备,它们所观察到的、产生的数据也是非常大的。去年的这个图片相信很多人在朋友圈都被刷屏过。这是人类所能观察到的一个划时代的新的图像,尽管我们作为外行可能不知道它具体的内涵是什么,但是都知道它很酷。

![](1001-lesson1/image-20230302194916461.png)

Expand Down
Loading

0 comments on commit 84a4fe6

Please sign in to comment.