fixes #65
doggy8088 committed Nov 18, 2023
# 第 07 天:解析 Git 资料结构 - 索引结构

我们知道在 Git 里两个重要的资料结构,分別是「物件」与「索引」,这篇文章主要用来解说「索引」的细节。使用 Git 版本控制的过程中,或许你可以很轻易的了解 git 指令的用法,不过那很容易流于死记,无法灵活运用,连 Linus Torvalds 都在邮件清单 (Mailing List) 中提到:「在使用者了解索引的意义之前,是无法完整了解 Git 的能力的」,因此,了解「索引」的用途十分重要。

## 关于索引

简单来说,「索引」的目的主要用来记录「有哪些文件即将要被提交到下一个 commit 版本中」。

Expand All @@ -21,8 +19,7 @@

举个例子来说,指令 `git diff --cached` 就与 `git diff --staged` 是完全同义的。

## 操作索引的指令

由于「索引」对 Git 来说十分重要,在大多数的指令中都会有跟 Git 索引相关的参数可用,不过我们大致列出几个直接与「索引」相关的指令来解说。

Expand All @@ -37,58 +34,60 @@
* modified (已修改的,代表文件已经被编辑过,或是文件内容与 HEAD 内容不一致的状态)
* staged (等待被 commit 的,代表下次执行 git commit 会将这些文件全部送入版本库)

### git status

取得 **工作目录** (working tree) 下的状态。


Git 仓库的运作,是将工作目录里的变化,通过更新索引的方式,将资料写入成 Git 物件。
Git 仓库的运作,是将工作目录里的变化,通过更新索引的方式,将资料写入成 Git 物件。

这里的 `git status` 指令,目的是显示出 **目前最新版****索引档** 之间的差异,这当中的差异包含了一些微妙的关系,我们用一个例子来解释这层关系。

以下是执行 git status 的结果:

G:\git-demo>git status
# On branch master
# Changes to be committed:
# (use "git reset HEAD <file>..." to unstage)
# new file: c.txt
# Changes not staged for commit:
# (use "git add <file>..." to update what will be committed)
# (use "git checkout -- <file>..." to discard changes in working directory)
# modified: a.txt
# Untracked files:
# (use "git add <file>..." to include in what will be committed)
# b.txt
G:\git-demo>git status
# On branch master
# Changes to be committed:
# (use "git reset HEAD <file>..." to unstage)
# new file: c.txt
# Changes not staged for commit:
# (use "git add <file>..." to update what will be committed)
# (use "git checkout -- <file>..." to discard changes in working directory)
# modified: a.txt
# Untracked files:
# (use "git add <file>..." to include in what will be committed)
# b.txt


* Changes to be committed (准备提交的变更)
* 这区有个 `new file: c.txt` 文件,代表 c.txt 是一个新文件,而且已经被标示可提交。
* 这代表着几件事:
1. **目前最新版** 并没有 c.txt 这个文件
2. **索引档** 已经加入了这个 c.txt 文件
3. 所以该文件会在执行 git commit 之后被存入下一个版本
* 这区有个 `new file: c.txt` 文件,代表 c.txt 是一个新文件,而且已经被标示可提交。
* 这代表着几件事:
1. **目前最新版** 并没有 c.txt 这个文件
2. **索引档** 已经加入了这个 c.txt 文件
3. 所以该文件会在执行 git commit 之后被存入下一个版本
* Changes not staged for commit (尚未准备提交的变更)
* 这区有个 `modified: a.txt` 文件,代表 a.txt 已经被变更,但尚未标示可提交。 (not staged)
* 这代表着几件事:
1. **目前最新版** 也有 a.txt 这个文件
2. **索引档** 尚未加入 a.txt 这个文件
3. 所以该文件就算执行了 git commit 也不会在下一版中出现
* 这区有个 `modified: a.txt` 文件,代表 a.txt 已经被变更,但尚未标示可提交。 (not staged)
* 这代表着几件事:
1. **目前最新版** 也有 a.txt 这个文件
2. **索引档** 尚未加入 a.txt 这个文件
3. 所以该文件就算执行了 git commit 也不会在下一版中出现
* Untracked files (未追踪的变更)
* 这区有个 `b.txt` 文件,代表 b.txt 尚未被追踪。(untracked)
* 这代表着几件事:
1. **目前最新版** 没有 b.txt 这个文件
2. **索引档** 也没有 b.txt 这个文件
3. 所以该文件就算执行了 git commit 也不会在下一版中出现
* 这区有个 `b.txt` 文件,代表 b.txt 尚未被追踪。(untracked)
* 这代表着几件事:
1. **目前最新版** 没有 b.txt 这个文件
2. **索引档** 也没有 b.txt 这个文件
3. 所以该文件就算执行了 git commit 也不会在下一版中出现

所以你可以看到,执行 git status 就是为了查出 **目前最新版****索引档** 之间的差异,最终只有 **目前最新版****索引档** 之间有差异的变更,才会真正储存到下一个 commit 物件里。

Expand All @@ -104,7 +103,9 @@

在执行 `git rm filename` 的时候,除了更新索引档之外,连工作目录下的文件也会一并被删除。若你只想删除索引档中的该档,又要保留工作目录下的实体文件,那么你可以在指令列加上 `--cached` 参数,就能做到,例如:

git rm --cached a.txt
git rm --cached a.txt

### git mv

Expand All @@ -122,28 +123,21 @@


## 今日小结

Git 里的「索引」是 Git 版控中最重要的观念,有了这层观念,也自然能得知,为什么每次提交变更都要打一些指令把变更给加进去。当然,也有许多好用的 GUI 工具可以帮你少打许多指令,不过在我们正式开始使用 Git 的 GUI 工具之前,我们还是多靠指令把观念给建立再说吧!

## 参考连结

* [Git - Recording Changes to the Repository](
* [Pro Git Book](
* [Git Magic - 繁体中文版](
* [Git (software) - Wikipedia, the free encyclopedia]( "Git (software) - Wikipedia, the free encyclopedia")


* [回目录](
* [前一天:解析 Git 资料结构 - 物件结构](
* [下一天:关于分支的基本观念与使用方式](


