Go 语言实战（9）：指针、引用和值

你鹅發表於 2022-6-20 15:53:00

Go 语言实战（9）：指针、引用和值

<p>在经过编写 CLI 程序的尝试之后，我们继续回来聊 Go 语言的基础知识。</p>
<p>相信实际写过一些代码之后，会更容易理解。</p>
<p></p>
<p>原计划这期聊数组和切片。考虑到聊切片时，无论如何绕不开指针和引用的话题，干脆提到前面来。</p>
<h2 id="目录">目录</h2>
<p></p>
<h2 id="指针">指针</h2>
<p>指针（Pointer）本质上是一个<strong>指向</strong>某块计算机内存的地址。就像日常的门牌地址一样。只不过内存地址是一个数字编号，对应的是一个个字节（byte）。</p>
<p>当然，高级语言能访问到的内存，经过了操作系统内存管理的抽象，并不是连续的物理内存，而是映射得到的虚拟内存。但现在不必关注这些细节，当它是连续内存就好。</p>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/pointer-mem.svg" alt=""></p>
<p>出于<strong>内存安全</strong>和<strong>屏蔽底层细节</strong>的考虑，C++ 以后的高级语言大多不再支持指针，而是改为使用『引用』。引用和指针的差别，我们后面说。</p>
<p>Go 作为 C 的『嫡亲』后继，为了性能和灵活性，保留了指针，而且用法基本一样。但 Go 增加了 <strong>逃逸分析</strong> 和 <strong>垃圾回收（GC）</strong>，一定程度上解决掉了悬挂指针和内存泄漏的问题，降低了开发者的认知负担。（注意，Go 还是可能发生内存泄漏，只是需要特定的条件，发生概率大大降低了。）</p>
<h3 id="Go-指针">Go 指针</h3>
<p>先上代码，来点直观认识</p>
<figure class="highlight go">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
<div class="line">5</div>
<div class="line">6</div>
<div class="line">7</div>
<div class="line">8</div>
<div class="line">9</div>
<div class="line">10</div>
<div class="line">11</div>
<div class="line">12</div>
<div class="line">13</div>
<div class="line">14</div>
<div class="line">15</div>
<div class="line">16</div>
<div class="line">17</div>
<div class="line">18</div>
<div class="line">19</div>
</td>
<td class="code">
<div class="line"><span class="comment">// 声明</span></div>
<div class="line"><span class="keyword">var</span> pa, pb *<span class="keyword">int</span></div>
<div class="line"> </div>
<div class="line"><span class="comment">// 取址</span></div>
<div class="line"><span class="keyword">var</span> a = <span class="number">10</span> <span class="comment">// 默认为 int</span></div>
<div class="line">pa = &a</div>
<div class="line"> </div>
<div class="line"><span class="comment">// 解引用（取值）</span></div>
<div class="line"><span class="keyword">var</span> b = *pa</div>
<div class="line"> </div>
<div class="line"><span class="comment">// 输出</span></div>
<div class="line">fmt.Println(<span class="string">"a:"</span>, a)</div>
<div class="line">fmt.Println(<span class="string">"b:"</span>, b)</div>
<div class="line">fmt.Println(<span class="string">"&a:"</span>, &a)</div>
<div class="line">fmt.Println(<span class="string">"&b:"</span>, &b)</div>
<div class="line">fmt.Println(<span class="string">"pa:"</span>, pa)</div>
<div class="line">fmt.Println(<span class="string">"pb:"</span>, pb)</div>
<div class="line">fmt.Println(<span class="string">"*pa:"</span>, *pa)</div>
<div class="line">fmt.Println(<span class="string">"*pb:"</span>, *pb)</div>
</td>
</tr>
</tbody>
</table>
</figure>
<blockquote>
<p>关于取址运算符 <code>&</code> 和解引用运算符 <code>*</code> 的详细介绍（优先级、可寻址等内容），请参考第 4 期的《运算符》。</p>
<p>解引用 dereference：取址 address 的反操作，意味根据类型，从地址中取出对应的值。</p>
</blockquote>
<p>上面的代码输出</p>
<figure class="highlight bash">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
<div class="line">5</div>
<div class="line">6</div>
<div class="line">7</div>
<div class="line">8</div>
</td>
<td class="code">
<div class="line">a: 10</div>
<div class="line">b: 10</div>
<div class="line">&a: 0xc0000140a0</div>
<div class="line">&b: 0xc0000140a8</div>
<div class="line">pa: 0xc0000140a0</div>
<div class="line">pb: <nil></div>
<div class="line">*pa: 10</div>
<div class="line">panic: runtime error: invalid memory address or nil pointer dereference</div>
</td>
</tr>
</tbody>
</table>
</figure>
<p>指针的零值是 <code>nil</code> ，对一个 <code>nil</code> 指针解引用会引起运行时错误，引发一个 panic。</p>
<p>通过下图，可以清晰看到4 个变量之间的关系。</p>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/example1.svg" alt=""></p>
<blockquote>
<p>注1：<code>int</code> 类型在 64 位机器上是 64 位，占据 8 个字节。</p>
<p>注2：两个指针实际上也是保存在内存上，但是为了特意区分，也为了避免内存的图示画得太长，所以把它们单独放在左边示意。</p>
</blockquote>
<p>指针允许程序以简洁的方式引用另一个（较大的）值而不必拷贝它，允许在不同的地方之间共享一个值，可以简化很多数据结构的实现。保留指针，让 Go 的代码更灵活，以及更好的性能表现。</p>
<h3 id="指针的类型">指针的类型</h3>
<p>指针是派生类型，派生自其它类型。类型 <code>*Type</code> 表示『指向 Type 类型变量的指针』，常常简称『Type 类型的指针』，其中 <code>Type</code> 可以为任意类型，被称作指针的基类型（base type）。换言之，从 <code>Type</code> 类型，派生出 <code>*Type</code> 类型。</p>
<p>前面说到，内存地址是一个编号，指针的底层类型（underlying type）相当于是整型数（<code>uintptr</code>），宽度与平台相关，保证可以存下内存地址。</p>
<p>但指针又不仅仅是一个整型数，上面还附加了类型信息。指针指向的类型不同，派生出的指针类型也不同。所以指针不是一个类型，而是一类类型；类型有无数多种，对应的指针（包括指向指针的指针）的类型也有无数种。</p>
<p><code>*int16</code> 跟 <code>*int8</code> 就是不同类型。它们虽然存了同样长度的地址，但基类型不同，解引用时会有不同的行为。不同类型的指针之间无法进行转换。（除非通过 <code>unsafe</code> 包进行强制转换。包名 unsafe 道出风险，这个包里的都是危险操作，后果自负。）</p>
<figure class="highlight go">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
<div class="line">5</div>
<div class="line">6</div>
<div class="line">7</div>
<div class="line">8</div>
<div class="line">9</div>
</td>
<td class="code">
<div class="line"><span class="comment">// 为了方便理解，写成二进制，高8位的字节是 3，低 8 位的字节是 1，对应的数字是 3x2^8+1 = 769</span></div>
<div class="line"><span class="keyword">var</span> c <span class="keyword">uint16</span> = <span class="number">0</span>b00000011_00000001</div>
<div class="line">pc16 := &c</div>
<div class="line">fmt.Println(<span class="string">"pc16:"</span>, pc16)</div>
<div class="line">fmt.Println(<span class="string">"*pc16:"</span>, *pc16)</div>
<div class="line"><span class="comment">// 为了演示，将 *uint16 强制转换为 *uint8，实际开发中不推荐，除非你清楚自己在做什么</span></div>
<div class="line">pc8 := (*<span class="keyword">uint8</span>)(unsafe.Pointer(pc16))</div>
<div class="line">fmt.Println(<span class="string">"pc8:"</span>, pc8)</div>
<div class="line">fmt.Println(<span class="string">"*pc8:"</span>, *pc8)</div>
</td>
</tr>
</tbody>
</table>
</figure>
<p>输出</p>
<figure class="highlight bash">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
</td>
<td class="code">
<div class="line">pc16: 0xc0000a2058</div>
<div class="line">*pc16: 769</div>
<div class="line">pc8: 0xc0000a2058</div>
<div class="line">*pc8: 1</div>
</td>
</tr>
</tbody>
</table>
</figure>
<p>可以看到，两个指针保存了同样的地址，按理说解引用取出的内容应该是一样的。但事实是，解引用还跟类型相关：地址只指明了取内容的起点，基类型指定取多少个字节，以及如何解释取出来的比特。在这里，对 <code>*uint16</code> 解引用取出了两个字节，按整型数解释为 <code>796</code> ；对 <code>*uint8</code> 解引用则取了一个字节，解释为 <code>1</code> 。</p>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/pointer-base-type.svg" alt=""></p>
<p>这里还得知了一个额外的信息：我的电脑是小端字节序，换句话说，数字是从低字节到高字节存储的，也就是 <code>00000001 00000011</code> ，跟手写的习惯是相反的，所以才会在只取一个字节时，取到了低字节。</p>
<h3 id="逃逸分析与垃圾回收">逃逸分析与垃圾回收</h3>
<p>在 C/C++ 里面使用指针，容易发生两类问题：</p>
<ul>
<li>
<p>悬空指针（dangling pointer）：又叫野指针（wild pointer），是指非空的指针没能指向相应类型的有效对象，或者换句话说，不能解析到一个有效的值。这有可能是对指针做了错误的运算，或者目标内存被意外回收了。</p>
</li>
<li>
<p>内存泄漏（memory leak）：是指因为疏忽或者错误，没有释放已经不再使用的内存，造成内存的浪费。在 C/C++ 这类没有内存管理的语言里，常见的泄漏原因是在释放动态分配的内存之前，就失去了对这些内存的控制。</p>
</li>
</ul>
<p>Go 里面不允许对指针做算术运算，基本排除对指针运算错误导致的问题。剩下还能出问题的，就是释放内存的时机：释放早了，悬空指针；释放晚了或者干脆没释放，内存泄漏。来看看 C 的例子：</p>
<figure class="highlight c">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
<div class="line">5</div>
<div class="line">6</div>
<div class="line">7</div>
<div class="line">8</div>
<div class="line">9</div>
<div class="line">10</div>
<div class="line">11</div>
<div class="line">12</div>
<div class="line">13</div>
<div class="line">14</div>
<div class="line">15</div>
<div class="line">16</div>
<div class="line">17</div>
<div class="line">18</div>
<div class="line">19</div>
<div class="line">20</div>
<div class="line">21</div>
<div class="line">22</div>
<div class="line">23</div>
<div class="line">24</div>
<div class="line">25</div>
<div class="line">26</div>
<div class="line">27</div>
<div class="line">28</div>
</td>
<td class="code">
<div class="line"><span class="comment">// 注意这是 C 代码，不要跟 Go 代码混淆</span></div>
<div class="line"><span class="meta">#<span class="meta-keyword">include</span> <span class="meta-string"><malloc.h></span></span></div>
<div class="line"> </div>
<div class="line"><span class="function"><span class="keyword">int</span>* <span class="title">getPtrOnStack</span><span class="params">()</span></span></div>
<div class="line">{</div>
<div class="line"><span class="comment">// n 分配在栈上，函数返回即被回收</span></div>
<div class="line"><span class="keyword">int</span> n;</div>
<div class="line"><span class="keyword">int</span>* pi = &n;</div>
<div class="line"><span class="keyword">return</span> pi;</div>
<div class="line">}</div>
<div class="line"> </div>
<div class="line"><span class="function"><span class="keyword">int</span>* <span class="title">mallocInt</span><span class="params">()</span></span></div>
<div class="line">{</div>
<div class="line"><span class="comment">// 动态分配的内存分配在堆上，需要自行释放</span></div>
<div class="line"><span class="keyword">return</span> (<span class="keyword">int</span>*)<span class="built_in">malloc</span>(<span class="keyword">sizeof</span>(<span class="keyword">int</span>));</div>
<div class="line">}</div>
<div class="line"> </div>
<div class="line"><span class="function"><span class="keyword">int</span> <span class="title">main</span><span class="params">()</span></span></div>
<div class="line">{</div>
<div class="line"><span class="comment">// pi 为悬空指针</span></div>
<div class="line"><span class="keyword">int</span>* pi = getPtrOnStack();</div>
<div class="line"><span class="keyword">int</span>* pi2 = mallocInt();</div>
<div class="line"><span class="comment">// 申请的内存没有释放，应该先 free(pi2)</span></div>
<div class="line">pi2 = <span class="number">0</span>;</div>
<div class="line"><span class="comment">// pi2 置零后，失去了对未释放内存的控制，因为地址已经找不回了</span></div>
<div class="line"><span class="comment">// 短时间内一次过运行的程序内存泄漏问题不大，到程序退出都会释放；</span></div>
<div class="line"><span class="comment">// 但对于需要持续运行的程序，内存泄漏会造成严重后果。</span></div>
<div class="line">}</div>
</td>
</tr>
</tbody>
</table>
</figure>
<p>Go 的解决方案是</p>
<ul>
<li>
<p>逃逸分析：由编译器对变量进行逃逸分析，判断变量的作用域是否超出函数的作用域，以此决定将内存分配在栈上还是堆上，不需要人工指定。这就解决了第一个问题，函数内部声明的变量，其内存可以在函数返回后继续使用。</p>
</li>
<li>
<p>垃圾回收：由运行时（runtime）负责不再引用的内存的回收。回收算法一直在改进，这里不展开。这就解决了第二个问题，当内存不再使用的时候，只要不引用即可（指针置零，或者指向别的内存），不需要手动释放。</p>
</li>
</ul>
<p>因为这些改进，Go 里面的指针看起来跟 C/C++ 差不多，实际使用的负担却小很多。</p>
<p>需要注意的是，垃圾回收无法解决『逻辑上』的内存泄漏。这是指程序逻辑已经不再用到某些内存，但是仍然持有这些内存的引用，导致垃圾回收无法识别并回收这些内存。这就好比清洁工只能保证地上和垃圾桶的干净，却无法判断办公桌上有哪些东西是没用的。</p>
<h3 id="字段选择器">字段选择器</h3>
<p>对于操作数 <code>x</code> ，如果想访问它的成员字段或者方法，可以使用字段选择器（field selector），实际上就是一个句点 <code>.</code> 加上字段名。</p>
<p>举例说 <code>p</code> 是 <code>Person</code> 类型的变量，而 <code>Person</code> 有一个 <code>Name</code> 字段和 <code>Run()</code> 方法，就可以通过 <code>p.Name</code> 和 <code>p.Run()</code> 访问。</p>
<p>这部分的详细内容，要等到结构体和方法部分再展开。这里只提一点与 C/C++ 的区别。</p>
<p>还是以 <code>p</code> 和 <code>Person</code> 为例。在 C/C++ 里，只有 <code>p</code> 是一个 <code>Person</code> 类型变量的时候（相当于Go 语言的 <code>var p Person</code> ），才能用句点访问成员字段。如果 <code>p</code> 是一个 <code>Person</code> 类型的指针（相当于 Go 的 <code>var p *Person</code> ），则要用箭头操作符 <code>-></code> 访问成员。<code>p->Name</code> 跟 <code>(*p).Name</code> 等价。</p>
<p>Go 里没有箭头操作符。两种操作都用字段选择器 <code>.</code> 表示。实际上这是 Go 提供的一个语法糖，当Go 发现 <code>p</code> 是一个指针而且没有相应名字的成员时，会自动在 <code>*p</code> 里寻找对应的成员。</p>
<p>这样做，好处是省了一个操作符（Go 真的很省操作符和关键字），并且将值变量和指针变量的使用统一起来，在很多场景中可以不必关心使用的是一个值还是一个指针。而坏处也在于，在一些场景混淆了这两者。这个也是到结构体和方法时再细说。这里给一个直观的例子：</p>
<figure class="highlight go">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
<div class="line">5</div>
<div class="line">6</div>
<div class="line">7</div>
<div class="line">8</div>
<div class="line">9</div>
<div class="line">10</div>
<div class="line">11</div>
<div class="line">12</div>
<div class="line">13</div>
<div class="line">14</div>
</td>
<td class="code">
<div class="line"><span class="keyword">type</span> Person <span class="keyword">struct</span> {</div>
<div class="line">Name <span class="keyword">string</span></div>
<div class="line">}</div>
<div class="line"> </div>
<div class="line"><span class="keyword">var</span> d Person</div>
<div class="line">d.Name = <span class="string">"David"</span></div>
<div class="line">fmt.Println(<span class="string">"d.Name"</span>, d.Name) <span class="comment">// 输出 d.Name David</span></div>
<div class="line"> </div>
<div class="line">pd := &d</div>
<div class="line">fmt.Println(<span class="string">"pd.Name"</span>, pd.Name) <span class="comment">// 输出 pd.Name David</span></div>
<div class="line"> </div>
<div class="line"><span class="comment">// 这部分无法通过编译，错误是 ppd.Name undefined (type **Person has no field or method Name)</span></div>
<div class="line"><span class="comment">// ppd := &pd</span></div>
<div class="line"><span class="comment">// fmt.Println("ppd.Name", ppd.Name)</span></div>
</td>
</tr>
</tbody>
</table>
</figure>
<p>从 <code>**Person</code> 的角度看，会觉得很不讲理：明明 <code>*Person</code> 也没有 <code>Name</code> 这个字段啊，为什么 <code>pd</code> 不报错？</p>
<p>因为编译器识别到它是一个指针，自动从 <code>*pd</code> 里找字段。但是这个忙只帮忙向下找一层，对于 <code>ppd</code> ，<code>ppd.Name</code> 不存在，<code>(*ppd).Name</code> 也没有，就放弃了。</p>
<p>不像在 C/C++ 里很多操作都依赖指针，指针的指针并不少见，Go 里很少用到多级指针，所以这种语法糖只包一层大部分情况够用。</p>
<h2 id="指针、引用和值">指针、引用和值</h2>
<blockquote>
<p>这三个概念既存在包含关系，又存在对比，解释起来非常拗口。如果你看完之后还是云里雾里，请耐心再多看几遍，或者实际写代码感受一下。如果还是不能理解，一定是我水平的问题，请先跳过这一部分。欢迎留言告知你的想法。</p>
</blockquote>
<p>在第 2 期《常量与变量》里，有提到值的定义：『无法进一步求值的表达式（expression）』，例如 <code>4 + 3 * 2 / 1</code> 的<strong>值</strong>是 <code>10</code> 。而常量和变量，则可以理解为值的容器。（尽管常量在具体实现上，往往是编译期直接替换为目标值。）</p>
<p>这个定义，强调与量并列。</p>
<p>值也可以理解为『可以被程序操作的实体的表示』。这时不强调与量的区别，如果一个变量保存了一个值，出于方便，有时也称这个变量为一个值。</p>
<p>虽然标题将指针、引用和值并列，其实<strong>引用和指针，本身也是值</strong>。它们都用来表示『可被程序操作的实体』。</p>
<p>同时<strong>指针是引用的一种</strong>，是最简单的透明引用。</p>
<p>换言之，三者之间构成这样一种包含关系：引用是值的一种特例，是一类<strong>可以间接访问其它值的值</strong>，区别于直接使用的值；指针是引用的一种特例，是一类简单的<strong>透明引用</strong>，区别于不透明的引用。</p>
<h3 id="指针和值">指针和值</h3>
<p>先对比指针和值。</p>
<p>如果不考虑实际使用，从理论上说，指针类型跟别的整型一样，也是一个『可操作实体』，所以它也是值。在Go 里，指针跟所有值一样，赋值和参数传递的时候发生了拷贝。</p>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/copy-on-assignment.svg" alt=""></p>
<p>但在使用中，大部分情况下，指针只是改善性能（避免拷贝）、提高代码灵活性（共享对象）、实现复杂数据结构的工具。我们<strong>并不关心指针的值本身，而是关心指针指向的值</strong>。为了方便讨论，指针变量跟它指向的值，常常会被等同看待。就像送礼或者颁奖时，不会有人举着汽车交给对方，而是会递交车钥匙；我们会将拿到车钥匙等同于拿到了车。（特别是 Go 取消了箭头操作符 <code>-></code>，值和指针都用同样的方式访问成员，更是弱化了这个区分。）</p>
<p>几乎没有人会关心指针保存的地址值是多少，只会关心它是否有效，两个地址是否相等。地址的大小对于程序逻辑几乎没有影响。</p>
<p>当强调指针和值的区别时，这里的值，就是指我们关心的，可以直接使用的值。</p>
<blockquote>
<p>实际上，这些区别同样存在于引用和值之间。只是指针的机制更简单透明，所以用了指针作为讨论的对象。</p>
</blockquote>
<h3 id="不透明引用">不透明引用</h3>
<p>引用（reference）是指可以让程序间接访问其它值的值。<strong>指针是最简单的、透明的引用</strong>，也因为其机制透明和自由使用，是最强大有效的引用。</p>
<p>但透明和自由，也要求使用者更了解底层细节，程序更容易出错。想降低使用难度，避免出错，就加上限制，屏蔽底层细节，变成不透明引用。例如，无法获取引用真实的值，无法控制引用的解释，强制的类型安全，禁止类型转换，甚至让它看起来像一个直接访问的值，不像引用。</p>
<p>当我们将指针和引用并列时，指的就是不透明引用。</p>
<p>来看看其它语言的情况：</p>
<ul>
<li>
<p>C++ 既有指针也有引用。C++ 的引用更接近别名（alias），是受限的指针（不能读取或修改地址值，也不需要显式的解引用，所有操作都作用于指向的值）。</p>
</li>
<li>
<p>Python 和 Java 都取消了指针，只保留了引用。Java 的基本类型是直接值，除此以外都是引用。Python 更彻底，一切皆对象，所有变量都是对象的引用。所以它们在赋值和传递时，没有拷贝对象，只拷贝引用。如果需要拷贝对象，就需要显式地调用拷贝函数或者克隆方法。一些 Python 教程很形象地称这种引用为『贴标签』。</p>
</li>
</ul>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/value-vs-reference.svg" alt=""></p>
<p>Go 语言的引用，不像一般意义上的引用。</p>
<p>其它语言的不透明引用，是一种<strong>语言级别的统一机制</strong>，是作为指针的替代方案出现的。</p>
<p>Go 的引用，则是在已经有了直接值和指针的前提下，<strong>针对特定类型的优化</strong>：为了兼顾易用性和性能，针对具体类型，在值和指针之间折中。每种引用类型，有自己独特的机制。一般是由一个结构体负责管理元数据，结构体里有一个指针，指向真正要使用的目标数据。</p>
<p>这种东西，如果在 C++ 或者 Java 里，就是一个官方提供的类（如 Java 的 <code>String</code> 类），可以看到它的内部机制。而 Go 引用的实现逻辑却内置在 runtime 里，不仅无法直接访问元数据，还表现得像在直接操作目标数据。你会以为它是个普通的值，直到某些行为跟想象中不一样，才想起了解它的底层结构。如果不去看 runtime 的源码，这些元数据结构体仿佛不存在。</p>
<p>Go 的引用类型有：</p>
<ul>
<li>
<p>字符串 <code>string</code>：底层的数据结构为 <code>stringStruct</code> ，里面有一个指针指向实际存放数据的字节数组，另外还记录着字符串的长度。不过由于 <code>string</code> 是只读类型（所有看起来对 <code>string</code> 变量的修改，实际上都是生成了新的实例），在使用上常常把它当做值类型看待。由于做了特殊处理，它甚至可以作为常量。<code>string</code> 也是唯一零值不为 <code>nil</code> 的引用类型。</p>
</li>
<li>
<p>切片（slice）：底层数据结构为 <code>slice</code> 结构体，整体结构跟 <code>stringStruct</code> 接近，只是多了一个容量（capacity）字段。数据存放在指针指向的底层数组里。</p>
</li>
<li>
<p>映射（map）：底层数据结构为 <code>hmap</code> ，数据存放在数据桶（buckets）中，桶对应的数据结构为 <code>bmap</code> 。</p>
</li>
<li>
<p>函数（func）：底层数据结构为 <code>funcval</code> ，有一个指向真正函数的指针，指向另外的 <code>_func</code> 或者 <code>funcinl</code> 结构体（<code>funcinl</code> 代表被行内优化之后的函数）。</p>
</li>
<li>
<p>接口（interface）：底层数据结构为 <code>iface</code> 或 <code>eface</code> （专门为空接口优化的结构体），里面持有动态值和值对应的真实类型。</p>
</li>
<li>
<p>通道（chan）：底层数据结构为 <code>hchan</code>，分别持有一个数据缓冲区，一个发送者队列和一个接收者队列。</p>
</li>
</ul>
<p>这些类型在直接赋值拷贝的时候，都只会拷贝它们的直接值，也就是<strong>元数据结构体</strong>；间接指向的底层数据，是在各个拷贝值之间共享的。除非是发生了类型转换这样的特殊情况。</p>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/slice-reference.svg" alt=""></p>
<p>如果觉得不好记忆，有一个识别引用类型的快捷办法：凡是零值是 <code>nil</code> 的，都是引用类型。指针作为特殊的透明引用，一般单独讨论。而字符串 <code>string</code> 因为做了特殊处理，零值为 <code>""</code> ，需要额外记住。除了引用类型和指针，剩下的类型都是直接值类型。</p>
<p>那些说引用类型只有需要 <code>make()</code> 的切片、映射、通道三种的说法，是<strong>错误</strong>的！</p>
<blockquote>
<p>如果不记得都有哪些类型，零值是什么，可以看第 3 期《类型》。或者看下图的整理：</p>
</blockquote>
<p><img src="https://jaycechant.info/images/golang-in-action-day9/go-types.png" alt=""></p>
<p>由于每一个类型的实现机制都有所不同，具体细节留到介绍这些类型时再讨论，不在这里展开。感兴趣可以到 <code>go目录/src/runtime</code> 下看源码（每个类型有自己单独的文件，如 <code>string.go</code>，个别没有单独源码的，在 <code>runtime2.go</code> 里面）。</p>
<blockquote>
<p>需要注意的是，Go 通过封装，刻意隐藏引用类型的内部细节。隐藏细节，意味着没有对这些细节作出承诺，这些细节完全可能在后续版本中变更。实际上这样的变更已经发生过。了解这些细节，是为了更好理解类型的一些特殊行为，而不是要依赖于这些细节。（考虑到海勒姆定律，这些细节最终还是会被一些程序依赖。）</p>
<p>由于『引用类型』这个术语边界不明，特别是 Go 的实现方式跟其它语言存在差异，在表述上常常会造成混乱和误解，go101 的作者老貘推荐在 Go 里改为使用『指针持有者类型』来代替。新术语是指一个类型要么本身就是一个指针，要么是一个包裹着指针的结构体，它的变量本身是一个直接值，这个值另外指向间接的值。当赋值或传参发生拷贝时，只拷贝了直接值部分，间接值被多个直接值共享。</p>
<p>这种提法提供了新的理解角度。但我仍然使用『引用类型』这个术语，是想强调这些类型的不透明属性。它们由 runtime 内置，其元数据和实现机制被封装隐藏。按照『指针持有者类型』的定义，我们也可以自行实现一个包裹指针的结构体。但这种结构体跟普通结构体没有什么区别，runtime 不会对它做特殊处理。</p>
</blockquote>
<h2 id="指针传递、引用传递和值传递">指针传递、引用传递和值传递</h2>
<p>因为指针和引用本质上也是值，字面意义上，Go 里面<strong>所有传递都是值传递</strong>。这句话正确却没有指导意义。</p>
<p>Go 里的赋值和传参，总是会把传递的值<strong>本身</strong>拷贝一份。但如果这个（直接）值指向别的（间接）值，它所指向的（间接）值不会发生递归拷贝。就好比把大门钥匙多配一把交出去，而不是新建一模一样的房子。</p>
<p>因为这个特性，加上前面介绍的直接值、不透明引用和指针的区别，这三种传递在使用上是有区别的。区分也很简单，赋值和参数的类型是什么类型，就是对应的传递方式。</p>
<ul>
<li>
<p>（直接）值传递：值发生了拷贝。对新值的任何修改，都不会影响原来的值。</p>
<p>除非这个值是一个结构体，结构体成员字段里有引用类型或者指针，那么对这个字段而言，则是引用传递/指针传递。</p>
</li>
<li>
<p>引用传递：元数据发生了拷贝，但底层的间接值没有拷贝，仍然共享。</p>
<ul>
<li>
<p>对间接值的修改，会影响所有副本。（如，修改切片里的某个元素，就是修改了底层数组里的某个元素）</p>
</li>
<li>
<p>但对元数据的修改则不会影响其它副本。（如，对切片提取子切片，实际上修改了切片的访问范围）</p>
</li>
<li>
<p>有一种特殊的情况，就是修改元数据时改变了指向的间接值的指针，这之后对间接值的修改，都不再会影响其它副本。因为不再共享间接值。（如，对切片追加元素时，促发了底层数组的重新分配，指向了新的底层数组）</p>
</li>
</ul>
</li>
<li>
<p>指针传递：指针值（地址）发生了拷贝，共享指向的值。对间接值的修改，会影响所有副本。由于 Go 不允许对指针进行运算，不存在意外改变指针的情况。而如果是给指针赋新的值，后续的修改当然不再影响旧值指向的值。由于指针的机制透明，这点很好理解。</p>
</li>
</ul>
<p>因为指针本身也是一种引用，本来指针和引用可以合并讨论。但由于引用屏蔽了实现细节，使得程序员不一定知道对引用的操作，作用的具体是哪一部分，也就比透明的指针多了更多的意外情况需要指出。</p>
<h2 id="练习题">练习题</h2>
<p>以下代码有 8 个真假判断，请在不运行的情况下，判断 true 还是 false，并说出理由。</p>
<figure class="highlight go">
<table>
<tbody>
<tr>
<td class="gutter">
<div class="line">1</div>
<div class="line">2</div>
<div class="line">3</div>
<div class="line">4</div>
<div class="line">5</div>
<div class="line">6</div>
<div class="line">7</div>
<div class="line">8</div>
<div class="line">9</div>
<div class="line">10</div>
<div class="line">11</div>
<div class="line">12</div>
<div class="line">13</div>
<div class="line">14</div>
<div class="line">15</div>
<div class="line">16</div>
<div class="line">17</div>
<div class="line">18</div>
<div class="line">19</div>
<div class="line">20</div>
<div class="line">21</div>
<div class="line">22</div>
<div class="line">23</div>
<div class="line">24</div>
<div class="line">25</div>
<div class="line">26</div>
<div class="line">27</div>
<div class="line">28</div>
<div class="line">29</div>
<div class="line">30</div>
<div class="line">31</div>
<div class="line">32</div>
<div class="line">33</div>
<div class="line">34</div>
<div class="line">35</div>
<div class="line">36</div>
<div class="line">37</div>
<div class="line">38</div>
<div class="line">39</div>
<div class="line">40</div>
<div class="line">41</div>
<div class="line">42</div>
<div class="line">43</div>
<div class="line">44</div>
<div class="line">45</div>
<div class="line">46</div>
<div class="line">47</div>
<div class="line">48</div>
<div class="line">49</div>
<div class="line">50</div>
<div class="line">51</div>
<div class="line">52</div>
<div class="line">53</div>
<div class="line">54</div>
<div class="line">55</div>
<div class="line">56</div>
</td>
<td class="code">
<div class="line"><span class="function"><span class="keyword">func</span> <span class="title">main</span><span class="params">()</span></span>{</div>
<div class="line"><span class="keyword">var</span> a1 = [<span class="number">5</span>]<span class="keyword">int</span>{<span class="number">1</span>, <span class="number">2</span>, <span class="number">3</span>, <span class="number">4</span>, <span class="number">5</span>}</div>
<div class="line"><span class="keyword">var</span> a2 = a1</div>
<div class="line">a2[<span class="number">0</span>] = <span class="number">99</span></div>
<div class="line"><span class="comment">//fmt.Println(a1, a2)</span></div>
<div class="line">fmt.Println(<span class="string">"a1==a2? "</span>, a1[<span class="number">0</span>] == a2[<span class="number">0</span>])</div>
<div class="line"> </div>
<div class="line"><span class="keyword">var</span> sa = a1[:]</div>
<div class="line">sa[<span class="number">1</span>] = <span class="number">88</span></div>
<div class="line"><span class="comment">//fmt.Println(a1, sa)</span></div>
<div class="line">fmt.Println(<span class="string">"a1==sa? "</span>, a1[<span class="number">1</span>] == sa[<span class="number">1</span>])</div>
<div class="line"> </div>
<div class="line"><span class="keyword">var</span> s1 = []<span class="keyword">int</span>{<span class="number">1</span>, <span class="number">2</span>, <span class="number">3</span>, <span class="number">4</span>, <span class="number">5</span>}</div>
<div class="line"><span class="keyword">var</span> s2 = s1</div>
<div class="line">s2[<span class="number">0</span>] = <span class="number">99</span></div>
<div class="line"><span class="comment">//fmt.Println(s1, s2)</span></div>
<div class="line">fmt.Println(<span class="string">"s1==s2? "</span>, s1[<span class="number">0</span>] == s2[<span class="number">0</span>])</div>
<div class="line"> </div>
<div class="line"><span class="keyword">var</span> s3 = s2[<span class="number">1</span>:<span class="number">4</span>]</div>
<div class="line">s3[<span class="number">0</span>] = <span class="number">88</span></div>
<div class="line"><span class="comment">//fmt.Println(s1, s3)</span></div>
<div class="line">fmt.Println(<span class="string">"s1==s3? "</span>, s1[<span class="number">1</span>] == s3[<span class="number">0</span>])</div>
<div class="line"> </div>
<div class="line"><span class="keyword">var</span> s4 = <span class="built_in">append</span>(s2, <span class="number">6</span>)</div>
<div class="line">s4[<span class="number">2</span>] = <span class="number">77</span></div>
<div class="line"><span class="comment">//fmt.Println(s1, s4)</span></div>
<div class="line">fmt.Println(<span class="string">"s1==s4? "</span>, s1[<span class="number">2</span>] == s4[<span class="number">2</span>])</div>
<div class="line"> </div>
<div class="line"><span class="keyword">var</span> oldLen <span class="keyword">int</span></div>
<div class="line"> </div>
<div class="line">oldLen = <span class="built_in">len</span>(s1)</div>
<div class="line"><span class="comment">//fmt.Println(s1)</span></div>
<div class="line">appendInt(s1, <span class="number">6</span>)</div>
<div class="line"><span class="comment">//fmt.Println(s1)</span></div>
<div class="line">fmt.Println(<span class="string">"len(s1)==oldLen+1?"</span>, <span class="built_in">len</span>(s1) == oldLen+<span class="number">1</span>)</div>
<div class="line"> </div>
<div class="line">oldLen = <span class="built_in">len</span>(s1)</div>
<div class="line"><span class="comment">//fmt.Println(s1, s2)</span></div>
<div class="line">appendIntPtr(&s2, <span class="number">6</span>)</div>
<div class="line"><span class="comment">//fmt.Println(s1, s2)</span></div>
<div class="line">fmt.Println(<span class="string">"len(s1)==oldLen+1?"</span>, <span class="built_in">len</span>(s1) == oldLen+<span class="number">1</span>)</div>
<div class="line"> </div>
<div class="line">oldLen = <span class="built_in">len</span>(s1)</div>
<div class="line"><span class="comment">//fmt.Println(s1)</span></div>
<div class="line">appendIntPtr(&s1, <span class="number">6</span>)</div>
<div class="line"><span class="comment">//fmt.Println(s1)</span></div>
<div class="line">fmt.Println(<span class="string">"len(s1)==oldLen+1?"</span>, <span class="built_in">len</span>(s1) == oldLen+<span class="number">1</span>)</div>
<div class="line">}</div>
<div class="line"> </div>
<div class="line"><span class="function"><span class="keyword">func</span> <span class="title">appendInt</span><span class="params">(s []<span class="keyword">int</span>, elems ...<span class="keyword">int</span>)</span></span> {</div>
<div class="line">s = <span class="built_in">append</span>(s, elems...)</div>
<div class="line">}</div>
<div class="line"> </div>
<div class="line"><span class="function"><span class="keyword">func</span> <span class="title">appendIntPtr</span><span class="params">(ps *[]<span class="keyword">int</span>, elems ...<span class="keyword">int</span>)</span></span> {</div>
<div class="line">*ps = <span class="built_in">append</span>(*ps, elems...)</div>
<div class="line">}</div>
</td>
</tr>
</tbody>
</table>
</figure>
<ul>
<li>
<p>满分：无需运行代码，全部判断正确。</p>
</li>
<li>
<p>优秀：有个别判断不确定，但看到运行结果可以推断出原因。</p>
</li>
<li>
<p>及格：有比较多的判断不确定，但在输出数组/切片元素（注释掉的代码行）之后能说出原因。</p>
</li>
<li>
<p>加把劲：即使看到元素输出，还是云里雾里。</p>
</li>
</ul>
<p>对于从头开始学习的朋友来说，即使感觉云里雾里也不要紧，因为练习题不可避免地涉及到下一期要讨论的 <strong>数组和切片</strong>。如果之前没有了解，判断不了也是正常。这道题既是这期的课后练习，也可以理解为下期的课前预习。</p>
<p>答案和解析会在下期公布。</p>
<h2 id="参考资料">参考资料</h2>
<ul>
<li>Value-英文维基：https://en.wikipedia.org/wiki/Value_(computer_science)</li>
<li>Reference-英文维基：https://en.wikipedia.org/wiki/Reference_(computer_science)</li>
<li>Pointer-英文维基：https://en.wikipedia.org/wiki/Pointer_(computer_programming)</li>
<li>值部-Go语言101：https://gfw.go101.org/article/value-part.html</li>
<li>https://jaycechant.info/2021/golang-in-action-day-9-pointer-reference-and-value/</li>
</ul><br><br>
来源：https://www.cnblogs.com/lidabo/p/16393500.html

頁: [1]

圆梦公社's Archiver

Go 语言实战（9）：指针、引用和值