kubernetes之kubeadmin安装部署

维鼎佛佑 發表於 2020-7-6 14:29:00

<h1 id="kubeadmin介绍">kubeadmin介绍</h1>
<p><code>kubeadm</code>是<code>Kubernetes</code>项目自带的及集群构建工具，负责执行构建一个最小化的可用集群以及将其启动等的必要基本步骤，<code>kubeadm</code>是<code>Kubernetes</code>集群全生命周期的管理工具，可用于实现集群的部署、升级、降级及拆除。<code>kubeadm</code>部署<code>Kubernetes</code>集群是将大部分资源以<code>pod</code>的方式运行，例如（<code>kube-proxy</code>、<code>kube-controller-manager</code>、<code>kube-scheduler</code>、<code>kube-apiserver</code>、<code>flannel</code>)都是以<code>pod</code>方式运行。</p>
<p><code>Kubeadm</code>仅关心如何初始化并启动集群，余下的其他操作，例如安装<code>Kubernetes Dashboard</code>、监控系统、日志系统等必要的附加组件则不在其考虑范围之内，需要管理员自行部署。</p>
<p><code>Kubeadm</code>集成了<code>Kubeadm init</code>和<code>kubeadm join</code>等工具程序，其中<code>kubeadm init</code>用于集群的快速初始化，其核心功能是部署Master节点的各个组件，而<code>kubeadm join</code>则用于将节点快速加入到指定集群中，它们是创建<code>Kubernetes</code>集群最佳实践的“快速路径”。另外，<code>kubeadm token</code>可于集群构建后管理用于加入集群时使用的认证令牌（t<code>oken</code>)，而<code>kubeadm reset</code>命令的功能则是删除集群构建过程中生成的文件以重置回初始状态。</p>
<p>kubeadm项目地址</p>
<p>kubeadm官方文档</p>
<h1 id="安装前期规划">安装前期规划</h1>
<h2 id="软件信息">软件信息</h2>
<table>
<thead>
<tr>
<th>软件</th>
<th>版本</th>
</tr>
</thead>
<tbody>
<tr>
<td>centos</td>
<td>7.6</td>
</tr>
<tr>
<td>kubeadm</td>
<td>1.15.6</td>
</tr>
<tr>
<td>kubelet</td>
<td>1.15.6</td>
</tr>
<tr>
<td>kubectl</td>
<td>1.15.6</td>
</tr>
<tr>
<td>coredns</td>
<td>1.15.6</td>
</tr>
<tr>
<td>dashborad</td>
<td>2.0.0</td>
</tr>
<tr>
<td>coredns</td>
<td>1.3.1</td>
</tr>
<tr>
<td>nginx-ingress</td>
<td>1.6.0</td>
</tr>
<tr>
<td>docker</td>
<td>18.xxx</td>
</tr>
<tr>
<td>Etcd</td>
<td>3.3.18</td>
</tr>
<tr>
<td>flannel</td>
<td>0.11</td>
</tr>
<tr>
<td>flannel</td>
<td>0.11</td>
</tr>
</tbody>
</table>
<h2 id="部署环境">部署环境</h2>
<table>
<thead>
<tr>
<th>角色</th>
<th>ip</th>
<th>组件</th>
</tr>
</thead>
<tbody>
<tr>
<td>slb</td>
<td>192.168.5.200</td>
<td>openretry</td>
</tr>
<tr>
<td>m1 + etcd1</td>
<td>192.168.5.3</td>
<td>kube-apiserver，kube-controller-manager，kube-scheduler，etcd</td>
</tr>
<tr>
<td>m2 + etcd2</td>
<td>192.168.5.4</td>
<td>kube-apiserver，kube-controller-manager，kube-scheduler，etcd</td>
</tr>
<tr>
<td>m3 + etcd3</td>
<td>192.168.5.7</td>
<td>kube-apiserver，kube-controller-manager，kube-scheduler，etcd</td>
</tr>
<tr>
<td>n1</td>
<td>192.168.5.5</td>
<td>kubelet，kube-proxy，docker，flannel</td>
</tr>
<tr>
<td>n2</td>
<td>192.168.5.6</td>
<td>kubelet，kube-proxy，docker，flannel</td>
</tr>
</tbody>
</table>
<h2 id="修改主机名">修改主机名</h2>
<p>按照上述表格角色设置对相应主机名</p>
<pre><code class="language-sh">hostnamectlset-hostname slb
hostnamectlset-hostname m1
hostnamectlset-hostname m2
hostnamectlset-hostname m3
hostnamectlset-hostnamen1
</code></pre>
<h2 id="各服务器etchosts-配置">各服务器/etc/hosts 配置</h2>
<p>除slb 外所有服务器相同</p>
<pre><code class="language-sh">cat /etc/hosts
192.168.5.3 m1
192.168.5.4 m2
192.168.5.7 m3
192.168.5.5 n1
192.168.5.6 n2
</code></pre>
<h2 id="关闭swap">关闭Swap</h2>
<pre><code>swapoff -a
sed 's/._swap._/#&/' /etc/fstab
</code></pre>
<h2 id="关闭防火墙和selinux">关闭防火墙和selinux</h2>
<p>全部服务器节点都要修改</p>
<pre><code class="language-sh">systemctl stop firewalld.service
systemctl disable firewalld.service
</code></pre>
<p>修改完selinux 重启服务器</p>
<pre><code class="language-sh">sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
</code></pre>
<h2 id="netbridge-和ip-转发设置">net.bridge 和ip 转发设置</h2>
<p>除slb 外全部服务器增加</p>
<pre><code class="language-sh">cat /etc/sysctl.conf
# 打开ip转发,下面4条都干上去
net.ipv4.ip_forward = 1
# Disable netfilter on bridges.
net.bridge.bridge-nf-call-iptables = 1
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-arptables = 1
</code></pre>
<p><code>sysctl -p</code> 命令使其生效</p>
<h2 id="集群安装时需要注意的点">集群安装时需要注意的点</h2>
<p>问题在安装的过程出现和总结。带着这些问题点安装k8s集群。会有收获。<br>
带着问题自己也查阅相关资料学习。安装中没有书写到特别的详细。自行查阅学习。</p>
<h3 id="集群hostname-处理">集群hostname 处理</h3>
<p>1、方法一<br>
统一写入到/etc/hosts 文件<br>
缺点：集群服务器过多，每次新增节点所有机器都要修改该文件</p>
<p>2、方法二<br>
自建dns 服务，强烈推荐该方法，每次修改只需在dns 服务中增加即可</p>
<h3 id="etcd-集群安装方式">etcd 集群安装方式</h3>
<p>两种方式只能使用其中一种，下边有详细介绍<br>
1、外部方式<br>
2、内部方式</p>
<h3 id="证书的过期时间">证书的过期时间</h3>
<p>两种方式。只能使用其中一种<br>
1、使用自己生成的证书，自定义证书过期时间方式<br>
2、重新编译kubeadm ，修改其生成证书时的时间方式</p>
<h3 id="kubelete-需要跟docker-同步使用systemd-驱动">kubelete 需要跟docker 同步使用systemd 驱动</h3>
<p>默认docker 是使用cgroup，kubelete 使用使用systemd，必须统一。<br>
最好使用systemd</p>
<h3 id="flannel-yaml-文件的设置的子网">flannel yaml 文件的设置的子网</h3>
<p>flannel yaml 文件中的子网必须跟kubeadm yaml文件中设置的子网地址一样。</p>
<h3 id="dashboard-官方的yaml-文件中权限问题">dashboard 官方的yaml 文件中权限问题</h3>
<p>dashboard 官方yaml 文件默认权限不过，需要自行修改。</p>
<h1 id="安装">安装</h1>
<p>本次安装使用的是etcd 外部集群模式，因为电脑配置有限，能开的虚拟机数量有限，本次安装的外部etcd，etcd 还是跟各master 在一起。生产环境中最好把etcd跟master 分开到不同服务器。<br>
<strong>安装外部etcd时跟master服务器不在同一服务器时，在安装初始化和加入其他master时需要把etcd的客户端证书提前复制到master节点相关位置存放。此位置跟下边的kube-config.yaml 文件中<code>etcd</code>配置的证书相关字段中必须相同</strong></p>
<h2 id="etcd-集群规划">etcd 集群规划</h2>
<p>使用kubeadm 安装k8s 集群，etcd 的安装有两种方式，一种是内部方式。一种是外部集群方式。两种安装方式有很大的区别。</p>
<h3 id="内部方式">内部方式</h3>
<p>使用<code>kubeadm init</code> 时默认安装etcd。etcd 跟master 在一台服务器上，这种方式优点是安装方便，初始化时就自动安装etcd。缺点是当master 服务器宕机后会间接造成etcd 服务也不能使用。集群资源变更过多，master服务器既要处理node 的请求连接，还要处理etcd 服务的请求连接。会造成服务器出现负载。内部方式还有一个特别的大的缺点：<strong>kubadm init 初始化的那台服务器的etcd 只是单独的etcd服务，后续使用<code>kubeadm join --control-plane </code>加入的master 中的etcd 组成集群还需要手动修改etcd服务器的yaml 文件。其他master同样使用kubeadm init 安装那etcd 就不是集群。各自都是单机版</strong></p>
<p>架构图<br>
<img src="index_files/0a1891af-8428-4660-826d-6ea118ea77c2.png" alt="" loading="lazy"></p>
<h3 id="外部方式">外部方式</h3>
<p>自己手动安装etcd集群，k8s 集群跟etcd 能通信就OK。<br>
这种安装方式不会出现内部方式的缺点。此方式缺点需要单独部署集群，<br>
不过使用ansible 或者写好安装脚本也快速方便。</p>
<p>架构图<br>
<img src="index_files/48aa453d-e710-47ec-acac-4fe018b82ec6.png" alt="" loading="lazy"></p>
<h2 id="安装docker">安装docker</h2>
<p>除slb 外所有服务器全部安装docker<br>
默认docker使用的是cgroupdriver 是cgroup，修改cgroupdriver 为systemd</p>
<pre><code class="language-sh">yum install -y yum-utils device-mapper-persistent-data lvm2
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
yum makecache fast
yum -y install docker-ce-18.09.9-3* docker-ce-cli-18.09.9-3*
mkdir /etc/docker/
cat >> /etc/docker/daemon.json <<EOF
{
"registry-mirrors": ["https://slwwbaoq.mirror.aliyuncs.com"],
"exec-opts": ["native.cgroupdriver=systemd"]
}
EOF
systemctl enable docker
systemctl start docker
</code></pre>
<h2 id="安装-ipvsadm">安装 ipvsadm</h2>
<p>除slb 外所有服务器全部安装ipvsadm<br>
kuberneter-proxy 使用ipvsadm 当做service 转发的负载均衡</p>
<pre><code class="language-sh">yum install ipvsadm -y
cat > /etc/sysconfig/modules/ipvs.modules <<EOF
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
EOF
</code></pre>
<p>添加权限加验证ipvs 模块是否开启</p>
<pre><code class="language-sh">chmod 755 /etc/sysconfig/modules/ipvs.modules && bash /etc/sysconfig/modules/ipvs.modules && lsmod | grep -e ip_vs -e nf_conntrack_ipv4
</code></pre>
<h2 id="安装etcd">安装etcd</h2>
<p>本次在etcd1 上操作。证书生成操作也可以在其他服务器上操作，生成完毕拷贝到相应服务器上。<br>
证书配置文件可执行文件存放目录</p>
<pre><code class="language-sh">mkdir -p /etc/etcd/{bin,cfg,ssl}
</code></pre>
<p>使用cfssl来生成自签证书，先下载cfssl工具：</p>
<pre><code class="language-sh">wget https://pkg.cfssl.org/R1.2/cfssl_linux-amd64

wget https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64

wget https://pkg.cfssl.org/R1.2/cfssl-certinfo_linux-amd64

chmod +x cfssl_linux-amd64 cfssljson_linux-amd64 cfssl-certinfo_linux-amd64

mv cfssl_linux-amd64 /usr/local/bin/cfssl

mv cfssljson_linux-amd64 /usr/local/bin/cfssljson

mv cfssl-certinfo_linux-amd64 /usr/bin/cfssl-certinfo
</code></pre>
<h3 id="生成证书">生成证书</h3>
<p>创建生成证书的文件临时目录</p>
<pre><code class="language-sh">mkdir /k8s-tmp
</code></pre>
<p>创建以下三个文件，文件在/k8s-tmp目录下，目录按照自己环境随意定</p>
<pre><code class="language-sh">cat /k8s-tmp/ca-config.json
{
"signing": {
"default": {
   "expiry": "87600h"
},
"profiles": {
   "www": {
      "expiry": "87600h",
      "usages": [
         "signing",
         "key encipherment",
         "server auth",
         "client auth"
   ]
   }
}
}
}

</code></pre>
<pre><code class="language-sh">cat /k8s-tmp/ca-csr.json
{
"CN": "etcd CA",
"key": {
   "algo": "rsa",
   "size": 2048
},
"names": [
   {
         "C": "CN",
         "L": "Beijing",
         "ST": "Beijing"
   }
]
}

</code></pre>
<pre><code class="language-shell">cat /k8s-tmp/server-csr.json
{
"CN": "etcd",
"hosts": [
"192.168.5.3",
"192.168.5.5",
"192.168.5.7",
"192.168.5.200",
"192.168.5.8",
"192.168.5.9"
],
"key": {
   "algo": "rsa",
   "size": 2048
},
"names": [
   {
         "C": "CN",
         "L": "BeiJing",
         "ST": "BeiJing"
   }
]
}

</code></pre>
<p>生成ca证书</p>
<pre><code class="language-sh">cd /etc/etcd/ssl/
</code></pre>
<pre><code class="language-sh">cfssl gencert -initca /k8s-tmp/ca-csr.json | cfssljson -bare ca
2020/01/10 22:08:08 generating a new CA key and certificate from CSR
2020/01/10 22:08:08 generate received request
2020/01/10 22:08:08 received CSR
2020/01/10 22:08:08 generating key: rsa-2048
2020/01/10 22:08:08 encoded CSR
2020/01/10 22:08:08 signed certificate with serial number 490053314682424709503949261482590717907168955991

生成域名证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=/k8s-tmp/ca-config.json -profile=www /k8s-tmp/server-csr.json | cfssljson -bare server
2020/01/10 22:11:21 generate received request
2020/01/10 22:11:21 received CSR
2020/01/10 22:11:21 generating key: rsa-2048
ca-key.pemca.pemserver-key.pemserver.pem
2020/01/10 22:11:21 encoded CSR
2020/01/10 22:11:21 signed certificate with serial number 308419828069657306052544507320294995575828716921
2020/01/10 22:11:21 This certificate lacks a "hosts" field. This makes it unsuitable for
websites. For more information see the Baseline Requirements for the Issuance and Management
of Publicly-Trusted Certificates, v.1.1.6, from the CA/Browser Forum (https://cabforum.org);
specifically, section 10.2.3 ("Information Requirements").
</code></pre>
<p>生成的文件</p>
<pre><code class="language-sh">ls /etc/etcd/ssl/*
ca-key.pemca.pemserver-key.pemserver.pem
</code></pre>
<h3 id="安装etcd-1">安装etcd</h3>
<p>二进制包下载地址：https://github.com/coreos/etcd/releases/tag/v3.3.18</p>
<p>解压二进制包：</p>
<pre><code class="language-sh">wget https://github.com/etcd-io/etcd/releases/download/v3.3.18/etcd-v3.3.18-linux-amd64.tar.gz

tar zxvf etcd-v3.3.18-linux-amd64.tar.gz

# mv etcd-v3.3.18-linux-amd64/{etcd,etcdctl} /etc/etcd/bin/

</code></pre>
<p>创建数据存放目录</p>
<pre><code class="language-sh">mkdir /data/etcd-data
</code></pre>
<p>配置文件</p>
<pre><code class="language-sh"> cat /etc/etcd/cfg/etcd.conf
#
ETCD_NAME="etcd01"
ETCD_DATA_DIR="/data/etcd-data"
ETCD_LISTEN_PEER_URLS="https://192.168.5.3:2380"
ETCD_LISTEN_CLIENT_URLS="https://192.168.5.3:2379"
#
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.5.3:2380"
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.5.3:2379"
ETCD_INITIAL_CLUSTER="etcd02=https://192.168.5.4:2380,etcd03=https://192.168.5.7:2380,etcd01=https://192.168.5.3:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"

</code></pre>
<ul>
<li>ETCD_NAME 节点名称</li>
<li>ETCD_DATA_DIR 数据目录</li>
<li>ETCD_LISTEN_PEER_URLS 集群通信监听地址</li>
<li>ETCD_LISTEN_CLIENT_URLS 客户端访问监听地址</li>
<li>ETCD_INITIAL_ADVERTISE_PEER_URLS 集群通告地址</li>
<li>ETCD_ADVERTISE_CLIENT_URLS 客户端通告地址</li>
<li>ETCD_INITIAL_CLUSTER 集群节点地址</li>
<li>ETCD_INITIAL_CLUSTER_TOKEN 集群Token</li>
<li>ETCD_INITIAL_CLUSTER_STATE 加入集群的当前状态，new是新集群，existing表示加入已有集群</li>
</ul>
<p>systemd管理etcd：</p>
<pre><code class="language-sh">cat /usr/lib/systemd/system/etcd.service

Description=Etcd Server
After=network.target
After=network-online.target
Wants=network-online.target

Type=notify
EnvironmentFile=/etc/etcd/cfg/etcd.conf
ExecStart=/etc/etcd/bin/etcd --name=${ETCD_NAME} --data-dir=${ETCD_DATA_DIR} --listen-peer-urls=${ETCD_LISTEN_PEER_URLS} --listen-client-urls=${ETCD_LISTEN_CLIENT_URLS},http://127.0.0.1:2379 --advertise-client-urls=${ETCD_ADVERTISE_CLIENT_URLS} --initial-advertise-peer-urls=${ETCD_INITIAL_ADVERTISE_PEER_URLS} --initial-cluster=${ETCD_INITIAL_CLUSTER} --initial-cluster-token=${ETCD_INITIAL_CLUSTER_TOKEN} --initial-cluster-state=new --cert-file=/etc/etcd/ssl/server.pem --key-file=/etc/etcd/ssl/server-key.pem --peer-cert-file=/etc/etcd/ssl/server.pem --peer-key-file=/etc/etcd/ssl/server-key.pem --trusted-ca-file=/etc/etcd/ssl/ca.pem --peer-trusted-ca-file=/etc/etcd/ssl/ca.pem
Restart=on-failure
LimitNOFILE=65536

WantedBy=multi-user.target

</code></pre>
<p>启动并设置开启启动：</p>
<pre><code class="language-sh">systemctl start etcd

systemctl enable etcd

</code></pre>
<p><strong>在etcd2 和 etcd3 跟etcd1 操作一抹一样。唯一不同的是<code>etcd</code>配置文件中的<code>ETCD_NAME</code> <code>ETCD_LISTEN_CLIENT_URLS</code> <code>ETCD_LISTEN_PEER_URLS ETCD_INITIAL_ADVERTISE_PEER_URLS</code> <code>ETCD_ADVERTISE_CLIENT_URLS </code><br>
四个地方需要修改</strong></p>
<p>都部署完成后，检查etcd集群状态：</p>
<pre><code class="language-sh">/etc/etcd/bin/etcdctl --ca-file=/etc/etcd/ssl/ca.pem --cert-file=/etc/etcd/ssl/server.pem --key-file=/etc/etcd/ssl/server-key.pem --endpoints="https://192.168.5.3:2379,https://192.168.5.4:2379,https://192.168.5.5:2379" cluster-health

member 24586baafb4ab4b8 is healthy: got healthy result from https://192.168.5.7:2379
member 90b0b3dde8b183f1 is healthy: got healthy result from https://192.168.5.3:2379
member 94c0f494655271a4 is healthy: got healthy result from https://192.168.5.4:2379
cluster is healthy

</code></pre>
<p>如果输出上面信息，就说明集群部署成功。如果有问题第一步先看日志：/var/log/message 或 journalctl -u etc</p>
<h2 id="安装openresty">安装openresty</h2>
<p>安装依赖</p>
<pre><code class="language-sh">yum -y install pcre-devel openssl-devel gcc curl postgresql-devel
</code></pre>
<p>下载安装包</p>
<pre><code class="language-sh">cd /usr/src/
wget https://openresty.org/download/openresty-1.15.8.2.tar.gz
</code></pre>
<p>编译安装</p>
<pre><code class="language-sh">tar xf /usr/src/openresty-1.15.8.2.tar.gz
cd /usr/src/openresty-1.15.8.2/
./configure--with-luajit --without-http_redis2_module --with-http_iconv_module --with-http_postgres_module
make && make install
</code></pre>
<p>ln -s /usr/local/openresty/nginx/sbin/nginx /usr/bin/nginx</p>
<p>配置tcp模式负载均衡</p>
<pre><code class="language-sh">cat /usr/local/openresty/nginx/conf/nginx.conf

#usernobody;
worker_processes1;

#error_loglogs/error.log;
#error_loglogs/error.lognotice;
#error_loglogs/error.loginfo;

#pid    logs/nginx.pid;

events {
worker_connections1024;
}

stream {
   server {
   listen 6443;
   proxy_pass kubeadm;
}
include servers/*;
}

http {
include    mime.types;
default_typeapplication/octet-stream;

#log_formatmain'$remote_addr - $remote_user [$time_local] "$request" '
#                '$status $body_bytes_sent "$http_referer" '
#                '"$http_user_agent" "$http_x_forwarded_for"';

#access_loglogs/access.logmain;

sendfile    on;
#tcp_nopush on;

#keepalive_timeout0;
keepalive_timeout65;
include servers/*;
#gzipon;

server {
   listen    80;
   server_namelocalhost;

   #charset koi8-r;

   #access_loglogs/host.access.logmain;

   location / {
         root html;
         indexindex.html index.htm;
   }

   error_page 500 502 503 504/50x.html;
   location = /50x.html {
         root html;
   }

}

}
</code></pre>
<pre><code class="language-sh">cat /usr/local/openresty/nginx/conf/servers/k8s.com
upstream kubeadm {
   server 192.168.5.3:6443 weight=10 max_fails=30 fail_timeout=10s;
   server 192.168.5.4:6443 weight=10 max_fails=30 fail_timeout=10s;
   server 192.168.5.7:6443 weight=10 max_fails=30 fail_timeout=10s;
}
</code></pre>
<p><strong>配置文件中最核心的点是</strong></p>
<pre><code class="language-sh">stream {
   server {
   listen 6443;
   proxy_pass kubeadm;
}
include servers/*;
}
</code></pre>
<p>启动openrety</p>
<pre><code class="language-sh">nginx
</code></pre>
<p>查看监听状态</p>
<pre><code class="language-sh">netstat -anptl | grep 6443
tcp    0    0 0.0.0.0:6443          0.0.0.0:*             LISTEN    7707/nginx: master
</code></pre>
<h2 id="安装-kubeadm-kubectl--kubelet">安装 kubeadm kubectlkubelet</h2>
<p>五台服务器需要全部安装<br>
<strong>配置yum 源</strong></p>
<pre><code class="language-sh">cat <<EOF > /etc/yum.repos.d/kubernetes.repo

name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

</code></pre>
<p><strong>安装</strong></p>
<pre><code class="language-sh">yum install -y kubeadm-1.15.6 kubectl-1.15.6 kubelet-1.15.6
</code></pre>
<h2 id="kubeadm-替换">kubeadm 替换</h2>
<p><strong>在m1 上操作，生成新的kubeadm 替换掉旧的，所有服务器都要替换</strong><br>
默认安装的kubeadm 安装的k8s 集群的证书只有一年时间。<br>
需要每年重新生成新的证书，在重新生成证书时容易导致集群出现宕机等状态。因此需要修改源代码修改证书有效期时间，重新编译kubeadm。</p>
<h3 id="安装go环境">安装go环境</h3>
<pre><code class="language-sh">cd /usr/src
wget https://dl.google.com/go/go1.12.14.linux-amd64.tar.gz
tar -zxf /usr/src/go1.12.14.linux-amd64.tar.gz
mv go /usr/local/

echo "export PATH=$PATH:/usr/local/go/bin" >>/etc/profile
source /etc/profile
</code></pre>
<h3 id="重新编译kubeadm">重新编译kubeadm</h3>
<p>下载源代码,上传源代码到192.168.5.3服务器的/usr/src 下<br>
下载地址：https://github.com/kubernetes/kubernetes/releases/tag/v1.15.6</p>
<pre><code class="language-sh">cd /usr/src && tar xf kubernetes-1.15.6.tar.gz

</code></pre>
<p><strong>大于1.14 版本修改方式</strong><br>
修改<code>CertificateValidity = time.Hour * 24 * 365</code>为<code>CertificateValidity = time.Hour * 24 * 365 * 10</code></p>
<pre><code class="language-sh">cat /usr/src/kubernetes-1.15.6/kubeadm/app/constants/constants.go
const (
   // KubernetesDir is the directory Kubernetes owns for storing various configuration files
   KubernetesDir = "/etc/kubernetes"
   // ManifestsSubDirName defines directory name to store manifests
   ManifestsSubDirName = "manifests"
   // TempDirForKubeadm defines temporary directory for kubeadm
   // should be joined with KubernetesDir.
   TempDirForKubeadm = "tmp"

   // CertificateValidity defines the validity for all the signed certificates generated by kubeadm
   //CertificateValidity = time.Hour * 24 * 365
   CertificateValidity = time.Hour * 24 * 365 * 10
</code></pre>
<p>修改完毕编译生成kubeadm</p>
<pre><code class="language-sh">cd /usr/src/kubernetes-1.15.6/ && make WHAT=cmd/kubeadm GOFLAGS=-v
</code></pre>
<p>将kubeadm 文件拷贝替换系统中原有kubeadm</p>
<pre><code class="language-sh">cp /usr/bin/kubeadm /usr/bin/kubeadm.origin
cp /usr/src/kubernetes-1.15.6/_output/bin/kubeadm /usr/bin/kubeadm
</code></pre>
<p><strong>注意：如果不确认重新编译的kubeadm 生成的证书是自己修改的有效时间，在初始化完毕一个master后使用<code>kubeadm alpha certs check-expiration</code>命令查看证书的时间（使用外部模式etcd 集群该命令不能使用。因为外部模式etcd集群证书是自己生成。该命令检测时会出现找不到etcd 证书报错）</strong></p>
<p>kubeadm alpha certs check-expiratio 命令的结果例子：<br>
查看 EXPIRES 字段跟初始化master时的日期做下对比</p>
<pre><code class="language-sh">kubeadm alpha certs check-expiration
CERTIFICATE             EXPIRES 字段跟初始化master时的日期做下对比RESIDUAL TIME EXTERNALLY MANAGED
admin.conf             Dec 27, 2029 15:47 UTC 9y          no
apiserver                Dec 27, 2029 15:47 UTC 9y          no
apiserver-etcd-client    Dec 27, 2029 15:47 UTC 9y          no
apiserver-kubelet-client Dec 27, 2029 15:47 UTC 9y          no
controller-manager.conf Dec 27, 2029 15:47 UTC 9y          no
etcd-healthcheck-client Dec 27, 2029 15:47 UTC 9y          no
etcd-peer                Dec 27, 2029 15:47 UTC 9y          no
etcd-server             Dec 27, 2029 15:47 UTC 9y          no
front-proxy-client       Dec 27, 2029 15:47 UTC 9y          no
scheduler.conf          Dec 27, 2029 15:47 UTC 9y          no
</code></pre>
<h2 id="kubelete-配置调整">kubelete 配置调整</h2>
<p>配置文件中增加<code>Environment="KUBELET_CGROUP_ARGS=--cgroup-driver=systemd"</code><br>
该参数是设置kubelet的cgroup drivers 跟docker 的一致</p>
<pre><code class="language-sh">cat /usr/lib/systemd/system/kubelet.service.d/10-kubeadm.conf
# Note: This dropin only works with kubeadm and kubelet v1.11+

Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf"
Environment="KUBELET_CONFIG_ARGS=--config=/var/lib/kubelet/config.yaml"
# This is a file that "kubeadm init" and "kubeadm join" generates at runtime, populating the KUBELET_KUBEADM_ARGS variable dynamically
EnvironmentFile=-/var/lib/kubelet/kubeadm-flags.env
Environment="KUBELET_CGROUP_ARGS=--cgroup-driver=systemd"
# This is a file that the user can use for overrides of the kubelet args as a last resort. Preferably, the user should use
# the .NodeRegistration.KubeletExtraArgs object in the configuration files instead. KUBELET_EXTRA_ARGS should be sourced from this file.
EnvironmentFile=-/etc/sysconfig/kubelet
ExecStart=
ExecStart=/usr/bin/kubelet $KUBELET_KUBECONFIG_ARGS $KUBELET_CONFIG_ARGS $KUBELET_KUBEADM_ARGS $KUBELET_EXTRA_ARGS
</code></pre>
<p>添加开机启动和启动kubelet</p>
<pre><code class="language-sh">systemctl enable kubelet
systemctl start kubelet
</code></pre>
<p><strong>kubelet 在没有初始化集群时启动后的状态错误的，等初始化完或者节点加入到集群后就自动恢复</strong></p>
<h2 id="安装初始化m1">安装初始化m1</h2>
<p>配置kubeadm-config.yaml<br>
配置文件文档链接：https://godoc.org/k8s.io/kubernetes/cmd/kubeadm/app/apis/kubeadm/v1beta2</p>
<pre><code class="language-sh">cat kubeadm-config.yaml
apiVersion: kubeadm.k8s.io/v1beta2
kind: InitConfiguration
bootstrapTokens:
- token: "783bde.3f89s0fje9f38fhf"
description: "another bootstrap token"
ttl: "0s"
usages:
- authentication
- signing
groups:
- system:bootstrappers:kubeadm:default-node-token
localAPIEndpoint:
advertiseAddress: "192.168.5.3"
bindPort: 6443
certificateKey: "e6a2eb8581237ab72a4f494f30285ec12a9694d750b9785706a83bfcbbbd2204"
---
apiVersion: kubeadm.k8s.io/v1beta2
kind: ClusterConfiguration
etcd:
external:
endpoints:
- https://192.168.5.3:2379
- https://192.168.5.4:2379
- https://192.168.5.7:2379
caFile: /etc/etcd/ssl/ca.pem
certFile: /etc/etcd/ssl/server.pem
keyFile: /etc/etcd/ssl/server-key.pem
networking:
serviceSubnet: "10.96.0.0/12"
podSubnet: "10.50.0.0/16"
dnsDomain: "cluster.local"
kubernetesVersion: "v1.15.6"
controlPlaneEndpoint: "192.168.5.200:6443"
apiServer:
certSANs:
- "192.168.5.3"
- "192.168.5.4"
- "192.168.5.7"
- "192.168.5.200"
- "192.168.5.10"
- "192.168.5.11"
timeoutForControlPlane: 4m0s
certificatesDir: "/etc/kubernetes/pki"
imageRepository: registry.aliyuncs.com/google_containers
useHyperKubeImage: false
clusterName: kubernetes
dns:
type: CoreDNS
---
apiVersion: kubeproxy.config.k8s.io/v1alpha1
kind: KubeProxyConfiguration
featureGates:
SupportIPVSProxyMode: true
mode: ipvs

</code></pre>
<p><strong>一些重要字段详解</strong></p>
<ul>
<li>
<p>bootstrapTokens.token<br>
该字段是指定node节点加入集群和其他master 节点加入集群自签证书功能所需的token值，可以使用 <code>kubeadm token generate</code>命令生成，该字段表示后续添加node 时指定的token 值为自定义的。而不是使用集群初始化时自动生成的值。该字段也可以注释不使用。初始化时master 时如果没有自定义。系统会默认生成。</p>
</li>
<li>
<p>bootstrapTokens.ttl<br>
设置token 值的有效时间，如果使用该字段按照默认为1天。<br>
指定字段值为 <code>0s</code> 代表token 永不过期。</p>
</li>
<li>
<p>localAPIEndpoint.advertiseAddress<br>
api server绑定的IP地址</p>
</li>
<li>
<p>localAPIEndpoint.bindPort<br>
api server 绑定的端口号</p>
</li>
<li>
<p>etcd<br>
该字段下的配置是使用外部自建etcd 集群，所需要的配置信息。包括etcd 集群地址、证书相关配置。</p>
</li>
<li>
<p>networking.serviceSubnet<br>
service 子网</p>
</li>
<li>
<p>networking.podSubnet<br>
pod 的子网，后续安装flannle 时需要跟该值对应</p>
</li>
<li>
<p>networking.dnsDomain<br>
域名解析中的根，如果该位置修改了就必须修改kebelet中的配置参数</p>
</li>
<li>
<p>kubernetesVersion<br>
指定安装的k8s 版本</p>
</li>
<li>
<p>controlPlaneEndpoint<br>
指定控制平台节点,可以写域名和ip地址。api serever如果是集群版，指定slb 地址</p>
</li>
<li>
<p>apiServer.certSANs<br>
该字段指定需要生成证书api server的地址</p>
</li>
<li>
<p>certificatesDir<br>
指定证书存放的位置，不配置默认存放为<code>/etc/kubernetes/pki</code> 目录下</p>
</li>
<li>
<p>imageRepository<br>
指定相应镜像的位置，默认是从<code>k8s.gcr.io</code>下载镜像，该地址需要特殊上网才能下载。修改镜像地址为阿里云镜像仓库<code>registry.aliyuncs.com/google_containers</code></p>
</li>
<li>
<p>dns.type<br>
指定安装的dns解析服务。默认coredn</p>
</li>
<li>
<p>featureGates.SupportIPVSProxyMode<br>
该字段表示proxy开启ipvs支持</p>
</li>
<li>
<p>mode<br>
该字段表示proxy 使用ipvs模式作为service 负载均衡</p>
</li>
</ul>
<p>初始化m1</p>
<pre><code class="language-sh">kubeadm init --config /k8s/kubeadm-config.yaml --upload-certs

</code></pre>
<p>等待出现以下结果初始化完毕<br>
<img src="index_files/4484547a-fe18-4b62-8d04-f5596622393e.png" alt="" loading="lazy"></p>
<p>生成kubectl 命令配置<br>
初始化结果已经提示，按照相关提示操作即可。后续使用kubeadm jion 加入的master或 node 也可以使用下边操作后，也可以使用kubectl命令</p>
<pre><code class="language-sh">mkdir -p $HOME/.kube && cp -i /etc/kubernetes/admin.conf $HOME/.kube/config && chown $(id -u):$(id -g) $HOME/.kube/config
</code></pre>
<p>使用kubectl 查看集群<br>
刚初始化完毕的集群，因为没有安装cni 网络插件。coredns 的状态是pending 状态</p>
<pre><code class="language-sh"># kubectl get pod -n kube-system
NAME                      READY STATUS RESTARTS AGE
coredns-bccdc95cf-h5jkz    0/1 Pending 0       5m
coredns-bccdc95cf-vcgbq    0/1 Pending 0       5m
kube-apiserver-m1          1/1 Running 0       5m

kube-controller-manager-m1 1/1 Running 0       5m

kube-proxy-72cdg          1/1 Running 0       5m

kube-scheduler-m1          1/1 Running 0       5m
</code></pre>
<h2 id="安装flannel-网络插件">安装flannel 网络插件</h2>
<p>flannel 相关资料<br>
https://github.com/coreos/flannel</p>
<p>配置flannel yaml 文件<br>
修改yaml文件中如下部分，<strong>network 字段设置的子网要跟初始化集群的kubeadm-config.yaml文件中设置的network 字段一样</strong></p>
<pre><code class="language-sh">net-conf.json: |
{
   "Network": "10.50.0.0/16",
   "Backend": {
   "Type": "vxlan"
   }
}
</code></pre>
<p>安装flannel<br>
flannel pod 是使用<code>DaemonSet</code> 安装的控制器安装的pod，<br>
后续执行集群加入命令加入到集群中的master 和node 节点都会在节点上启动一个flannel pod</p>
<pre><code class="language-sh">kubectl apply -f /k8s/kube-flannel.yml
</code></pre>
<p>安装成功后coredns 变为running，表示没有问题</p>
<pre><code class="language-sh">kubectl get pod -n kube-system
NAME                      READY STATUS RESTARTS AGE
coredns-bccdc95cf-h5jkz    1/1 Running 0
5m
coredns-bccdc95cf-vcgbq    1/1 Running 0       5m
kube-apiserver-m1          1/1 Running 0       5m

kube-flannel-ds-amd64-67tvq 1/1 Running 0       5m

kube-controller-manager-m1 1/1 Running 0       5m

kube-proxy-72cdg          1/1 Running 0       5m

kube-scheduler-m1          1/1 Running 0       5m
</code></pre>
<h2 id="安装其他master-节点">安装其他master 节点</h2>
<p>在其他master 执行以下命令。直接加入到集群中。在初始化时集群时有相关提示</p>
<pre><code class="language-sh">kubeadm join 192.168.5.200:6443 --token 783bde.3f89s0fje9f38fhf \
--discovery-token-ca-cert-hash sha256:5dd8f46b1e107e863d3d905411b591573cb65015e2c80386362599b81db09ef7 \
--control-plane --certificate-key e6a2eb8581237ab72a4f494f30285ec12a9694d750b9785706a83bfcbbbd2204
</code></pre>
<ul>
<li>token<br>
是在kubeadm-config.yaml 文件中设置的</li>
<li>--discovery-token-ca-cert-hash<br>
是初始化时自动生成的</li>
<li>--certificate-ke<br>
是kubeadm-config.yaml 文件中设置的，它的作用是用于自动从初始化的<code>m1</code> 上下载相关证书，对应init时的<code>--upload-certs</code>参数，只有在加入master 时才会使用<code>--certificate-ke</code></li>
</ul>
<h2 id="节点加入集群">节点加入集群</h2>
<p>在节点服务器执行以下命令，在初始化时集群时有相关提示</p>
<pre><code class="language-sh">kubeadm join 192.168.5.200:6443 --token 783bde.3f89s0fje9f38fhf --discovery-token-ca-cert-hash sha256:5dd8f46b1e107e863d3d905411b591573cb65015e2c80386362599b81db09ef7f
</code></pre>
<h2 id="查看加入的master-和-node节点">查看加入的master 和 node节点</h2>
<p>kubectl get node 命令</p>
<pre><code class="language-sh">kubectl get node
NAME STATUS ROLES AGE VERSION
m1 Ready master 7d22h v1.15.6
m2 Ready master 7d22h v1.15.6
m3 Ready master 7d22h v1.15.6
n1 Ready <none> 7d22h v1.15.6
n2 Ready <none> 7d22h v1.15.6
</code></pre>
<h2 id="如果不知道以上命令怎么查询-token-和-discovery-token-ca-cert-has-呢">如果不知道以上命令，怎么查询 token 和 discovery-token-ca-cert-has 呢？</h2>
<p>如果没有token，执行以下查询获得</p>
<pre><code class="language-sh">kubeadm token list
TOKEN                   TTL       EXPIRES                   USAGES                DESCRIPTION                                        EXTRA GROUPS
783bde.3f89s0fje9f38fhf <forever> <never>                   authentication,signing another bootstrap token                            system:bootstrappers:kubeadm:default-node-token
</code></pre>
<p>默认情况下，令牌在24小时后过期。如果在当前令牌过期后将节点加入群集，则可以通过在主节点上运行以下命令来创建新令牌：</p>
<pre><code class="language-sh">kubeadm token create
ih6qhw.tbkp26l64xivcca7
</code></pre>
<p>如果没有discovery-token-ca-cert-hash,执行以下查询获得。 --discovery-token-ca-cert-hash 的值可以配合多个token以重复使用</p>
<pre><code class="language-sh">openssl x509 -pubkey -in /etc/kubernetes/pki/ca.crt | openssl rsa -pubin -outform der 2>/dev/null | openssl dgst -sha256 -hex | sed 's/^.* //'
0a737675e1e37aa4025077b27ced8053fe84c363df11c506bfb512b88408697e
</code></pre>
<h2 id="安装dashboard">安装dashboard</h2>
<p>dashboard 是k8s 配套的的一个web 管理界面工具。它能管理k8s 集群的大多数功能。<br>
dashboard 默认安装的是使用https和 token 认证方式，相关资料到网站查看：https://github.com/kubernetes/dashboard。本次使用dashboard 的http方式安装。dashboard 默认镜像中使用9090端口，相关资料：https://github.com/kubernetes/dashboard/blob/master/aio/Dockerfile</p>
<h3 id="配置-dashboard-yaml文件">配置 dashboard yaml文件，</h3>
<p>文件修改以下配置<br>
<strong>注释默认文件中的ClusterRole</strong></p>
<pre><code class="language-sh">#kind: ClusterRole
#apiVersion: rbac.authorization.k8s.io/v1
#metadata:
# labels:
#k8s-app: kubernetes-dashboard
#name: kubernetes-dashboard
#rules:
# Allow Metrics Scraper to get metrics from the Metrics server
# - apiGroups: ["metrics.k8s.io"]
#resources: ["pods", "nodes"]
#verbs: ["get", "list", "watch"]
</code></pre>
<p>在ClusterRoleBinding 字段中绑定集群默认的Cluster-admin 角色。因为默认配置文件设置的ClusterRole 权限不足。</p>
<pre><code class="language-sh">apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
name: kubernetes-dashboard
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: cluster-admin
subjects:
- kind: ServiceAccount
name: kubernetes-dashboard
namespace: kubernetes-dashboard
</code></pre>
<p><strong>在容器配置字段添加</strong></p>
<pre><code class="language-sh">- containerPort: 9090
protocol: TCP
</code></pre>
<p><strong>在检测字段添加</strong></p>
<pre><code class="language-sh">httpGet:
scheme: HTTP
path: /
port: 9090
initialDelaySeconds: 30
timeoutSeconds: 30
</code></pre>
<p><strong>修改service 字段，修改类型为nodeport，添加9090 的映射</strong></p>
<pre><code class="language-sh">kind: Service
apiVersion: v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
spec:
ports:
- port: 443
   targetPort: 8443
   name: https
- port: 9090
   name: http
   targetPort: 9090
type: NodePort
selector:
k8s-app: kubernetes-dashboard
</code></pre>
<p><strong>完整的dashboard yaml 文件</strong></p>
<pre><code class="language-sh">cat dashboard.yaml
# Copyright 2017 The Kubernetes Authors.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

apiVersion: v1
kind: Namespace
metadata:
name: kubernetes-dashboard

---

apiVersion: v1
kind: ServiceAccount
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard

---

kind: Service
apiVersion: v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
spec:
ports:
- port: 443
   targetPort: 8443
   name: https
- port: 9090
   name: http
   targetPort: 9090
type: NodePort
selector:
k8s-app: kubernetes-dashboard

---

apiVersion: v1
kind: Secret
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard-certs
namespace: kubernetes-dashboard
type: Opaque

---

apiVersion: v1
kind: Secret
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard-csrf
namespace: kubernetes-dashboard
type: Opaque
data:
csrf: ""

---

apiVersion: v1
kind: Secret
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard-key-holder
namespace: kubernetes-dashboard
type: Opaque

---

kind: ConfigMap
apiVersion: v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard-settings
namespace: kubernetes-dashboard

---

kind: Role
apiVersion: rbac.authorization.k8s.io/v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
rules:
# Allow Dashboard to get, update and delete Dashboard exclusive secrets.
- apiGroups: [""]
resources: ["secrets"]
resourceNames: ["kubernetes-dashboard-key-holder", "kubernetes-dashboard-certs", "kubernetes-dashboard-csrf"]
verbs: ["get", "update", "delete"]
# Allow Dashboard to get and update 'kubernetes-dashboard-settings' config map.
- apiGroups: [""]
resources: ["configmaps"]
resourceNames: ["kubernetes-dashboard-settings"]
verbs: ["get", "update"]
# Allow Dashboard to get metrics.
- apiGroups: [""]
resources: ["services"]
resourceNames: ["heapster", "dashboard-metrics-scraper"]
verbs: ["proxy"]
- apiGroups: [""]
resources: ["services/proxy"]
resourceNames: ["heapster", "http:heapster:", "https:heapster:", "dashboard-metrics-scraper", "http:dashboard-metrics-scraper"]
verbs: ["get"]

---

#kind: ClusterRole
#apiVersion: rbac.authorization.k8s.io/v1
#metadata:
# labels:
#k8s-app: kubernetes-dashboard
#name: kubernetes-dashboard
#rules:
# Allow Metrics Scraper to get metrics from the Metrics server
# - apiGroups: ["metrics.k8s.io"]
#resources: ["pods", "nodes"]
#verbs: ["get", "list", "watch"]
---

apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: Role
name: kubernetes-dashboard
subjects:
- kind: ServiceAccount
name: kubernetes-dashboard
namespace: kubernetes-dashboard

---

apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
name: kubernetes-dashboard
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: cluster-admin
subjects:
- kind: ServiceAccount
name: kubernetes-dashboard
namespace: kubernetes-dashboard

---

kind: Deployment
apiVersion: apps/v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
spec:
replicas: 1
revisionHistoryLimit: 10
selector:
matchLabels:
   k8s-app: kubernetes-dashboard
template:
metadata:
   labels:
   k8s-app: kubernetes-dashboard
spec:
   containers:
   - name: kubernetes-dashboard
      image: kubernetesui/dashboard:v2.0.0-rc1
      imagePullPolicy: Always
      ports:
         - containerPort: 8443
         protocol: TCP
         - containerPort: 9090
         protocol: TCP
      args:
         - --auto-generate-certificates
         - --namespace=kubernetes-dashboard
         # Uncomment the following line to manually specify Kubernetes API server Host
         # If not specified, Dashboard will attempt to auto discover the API server and connect
         # to it. Uncomment only if the default does not work.
         # - --apiserver-host=http://my-address:port
      volumeMounts:
         - name: kubernetes-dashboard-certs
         mountPath: /certs
         # Create on-disk volume to store exec logs
         - mountPath: /tmp
         name: tmp-volume
      livenessProbe:
         httpGet:
         scheme: HTTPS
         path: /
         port: 8443
         initialDelaySeconds: 30
         timeoutSeconds: 30
         httpGet:
            scheme: HTTP
            path: /
            port: 9090
         initialDelaySeconds: 30
         timeoutSeconds: 30
      securityContext:
         allowPrivilegeEscalation: false
         readOnlyRootFilesystem: true
         runAsUser: 1001
         runAsGroup: 2001
   volumes:
   - name: kubernetes-dashboard-certs
      secret:
         secretName: kubernetes-dashboard-certs
   - name: tmp-volume
      emptyDir: {}
   serviceAccountName: kubernetes-dashboard
   nodeSelector:
   "beta.kubernetes.io/os": linux
   # Comment the following tolerations if Dashboard must not be deployed on master
   tolerations:
   - key: node-role.kubernetes.io/master
      effect: NoSchedule

---

kind: Service
apiVersion: v1
metadata:
labels:
k8s-app: dashboard-metrics-scraper
name: dashboard-metrics-scraper
namespace: kubernetes-dashboard
spec:
ports:
- port: 8000
   targetPort: 8000
selector:
k8s-app: dashboard-metrics-scraper

---

kind: Deployment
apiVersion: apps/v1
metadata:
labels:
k8s-app: dashboard-metrics-scraper
name: dashboard-metrics-scraper
namespace: kubernetes-dashboard
spec:
replicas: 1
revisionHistoryLimit: 10
selector:
matchLabels:
   k8s-app: dashboard-metrics-scraper
template:
metadata:
   labels:
   k8s-app: dashboard-metrics-scraper
   annotations:
   seccomp.security.alpha.kubernetes.io/pod: 'runtime/default'
spec:
   containers:
   - name: dashboard-metrics-scraper
      image: kubernetesui/metrics-scraper:v1.0.1
      ports:
         - containerPort: 8000
         protocol: TCP
      livenessProbe:
         httpGet:
         scheme: HTTP
         path: /
         port: 8000
         initialDelaySeconds: 30
         timeoutSeconds: 30
      volumeMounts:
      - mountPath: /tmp
         name: tmp-volume
      securityContext:
         allowPrivilegeEscalation: false
         readOnlyRootFilesystem: true
         runAsUser: 1001
         runAsGroup: 2001
   serviceAccountName: kubernetes-dashboard
   nodeSelector:
   "beta.kubernetes.io/os": linux
   # Comment the following tolerations if Dashboard must not be deployed on master
   tolerations:
   - key: node-role.kubernetes.io/master
      effect: NoSchedule
   volumes:
   - name: tmp-volume
      emptyDir: {}
</code></pre>
<h3 id="dashboard-安装">dashboard 安装</h3>
<pre><code class="language-sh">kubectl apply -f /k8s/dashboard.yaml
</code></pre>
<p>查看pod</p>
<pre><code class="language-sh">kubectl get pod -n kubernetes-dashboard
NAME                                     READY STATUS RESTARTS AGE
dashboard-metrics-scraper-6c554969c6-k6rbh 1/1 Running 0       3d4h
kubernetes-dashboard-9bff46df4-t7sn2       1/1 Running 1       4d1h
</code></pre>
<p>查看svc</p>
<pre><code class="language-sh">kubectl get svc -n kubernetes-dashboard
NAME                      TYPE    CLUSTER-IP    EXTERNAL-IP PORT(S)                      AGE
dashboard-metrics-scraper ClusterIP 10.104.248.58 <none>    8000/TCP                   4d1h
kubernetes-dashboard    NodePort 10.100.47.122 <none>    443:30735/TCP,9090:32701/TCP 4d1h
</code></pre>
<p>访问192.168.5.5:32701 出现以下界面<br>
<img src="index_files/6a0378f1-361d-4c78-9f50-feec34a42aba.png" alt="" loading="lazy"></p>
<h2 id="安装metrics-server">安装metrics-server</h2>
<p>k8s 1.13 不再使用heapster ，改为使用 metrics-server。</p>
<p>metrics-server github： https://github.com/kubernetes-incubator/metrics-server</p>
<p>主要修改<br>
1、添加两个参数 <code>--kubelet-preferred-address-types=InternalIP --kubelet-insecure-tls</code></p>
<p>2、<code>imagePullPolicy: Always</code>修改为<code>imagePullPolicy: IfNotPresent</code> 因为Always 每次都是从原地址去拉取，不能特殊上网。IfNotPresent node 有镜像优先使用</p>
<p>镜像的调整<br>
默认镜像是k8s.gcr.io/metrics-server-amd64:v0.3.1 自动拉取不到。先自行下载到node上修改镜像名称</p>
<pre><code class="language-sh">docker pull mirrorgooglecontainers/metrics-server-amd64:v0.3.1

docker tag mirrorgooglecontainers/metrics-server-amd64:v0.3.1 k8s.gcr.io/metrics-server-amd64:v0.3.1
</code></pre>
<p>创建存放yaml 文件目录，上传所有相关yaml 文件到该目录下</p>
<pre><code class="language-sh">mkdir -p /k8s/metrics-server/
</code></pre>
<p>yaml 文件调整</p>
<pre><code class="language-sh"># cat /k8s/metrics-server-deployment.yaml
---
apiVersion: v1
kind: ServiceAccount
...
---
apiVersion: extensions/v1beta1
kind: Deployment
...
spec:
   serviceAccountName: metrics-server
   volumes:
   # mount in tmp so we can safely use from-scratch images and/or read-only containers
   - name: tmp-dir
   emptyDir: {}
   containers:
   - name: metrics-server
   image: k8s.gcr.io/metrics-server-amd64:v0.3.1
   imagePullPolicy: Always
   args:
   - --kubelet-preferred-address-types=InternalIP
   - --kubelet-insecure-tls
   volumeMounts:
   - name: tmp-dir
      mountPath: /tmp
</code></pre>
<p>执行加载文件</p>
<p><code>$ kubectl create -f /k8s/metrics-server/</code></p>
<p>查看pod是否正常运行，查看pod日志是否报错</p>
<pre><code class="language-sh"># # kubectl -n kube-system get po,svc | grep metrics-server
pod/metrics-server-8665bf49db-5wv7l                            1/1 Running 0       31m
service/metrics-server                   NodePort 10.99.222.85 <none>    443:32443/TCP 23m

# kubectl -n kube-systemlogs -f metrics-server-8665bf49db-5wv7l
</code></pre>
<p>通过kubectl工具测试获取metrics数据</p>
<pre><code class="language-sh"># kubectl get --raw "/apis/metrics.k8s.io/v1beta1/nodes"
{
"kind": "NodeMetricsList",
"apiVersion": "metrics.k8s.io/v1beta1",
"metadata": {
"selfLink": "/apis/metrics.k8s.io/v1beta1/nodes"
},
"items": [
{
   "metadata": {
   "name": "master02",
   "selfLink": "/apis/metrics.k8s.io/v1beta1/nodes/master02",
   "creationTimestamp": "2019-01-29T10:02:00Z"
   },
   "timestamp": "2019-01-29T10:01:48Z",
   "window": "30s",
   "usage": {
   "cpu": "131375532n",
   "memory": "989032Ki"
   }
},
...

</code></pre>
<p>使用top确认数据</p>
<pre><code class="language-sh">#kubectl top nodes
NAME    CPU(cores) CPU% MEMORY(bytes) MEMORY%
master01 200m       2% 1011Mi       3%
master02 451m       5% 967Mi       3%
master03 423m       5% 1003Mi       3%
node01 84m       1% 440Mi       1%
#kubectl top pod
NAME                   CPU(cores) MEMORY(bytes)
myip-7644b545d9-htg5z 0m       1Mi
myip-7644b545d9-pnwrn 0m       1Mi
myip-7644b545d9-ptnqc 0m       1Mi
tools-657d877fc5-4cfdd 0m       0Mi
</code></pre>
<h2 id="ingress-和ingress-controllers">ingress 和ingress-Controllers</h2>
<p>简易介绍ingress<br>
ingress相当于nginx 配置中的 server + upstream<br>
ingress-Controllers 相当于nginx 服务。它们的产生是为的解决默认service 是tcp 层的负载均衡、service使用nodeport 模式还需要记录相关端口，端口数量还有限制。使用ingress 和 ingress-Controllers 能完美解决该问题。ingress-Controllers 部署完毕后，ingress 配置关联集群中的service，ingress-Controllers 自动把相关配置同步过来（前提是在部署时添加了授权）</p>
<p>官方资料：https://v1-15.docs.kubernetes.io/docs/concepts/services-networking/ingress/ 和 https://v1-15.docs.kubernetes.io/docs/concepts/services-networking/ingress-controllers/</p>
<h3 id="使用nginx当-ingress-控制器">使用nginx当 ingress 控制器</h3>
<p>相关资料: https://docs.nginx.com/nginx-ingress-controller/installation/building-ingress-controller-image/</p>
<p>github 地址：https://github.com/nginxinc/kubernetes-ingress/</p>
<p><strong>nginx-ingress yaml 文件</strong><br>
修改nginx 的image地址，默认使用的不是稳定版，修改为 <code>nginx/nginx-ingress:1.6.0</code></p>
<pre><code class="language-sh">cat kube-nginx-ingress.yaml
apiVersion: v1
kind: Namespace
metadata:
name: nginx-ingress
---
apiVersion: v1
kind: ServiceAccount
metadata:
name: nginx-ingress
namespace: nginx-ingress
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
name: nginx-ingress
rules:
- apiGroups:
- ""
resources:
- services
- endpoints
verbs:
- get
- list
- watch
- apiGroups:
- ""
resources:
- secrets
verbs:
- get
- list
- watch
- apiGroups:
- ""
resources:
- configmaps
verbs:
- get
- list
- watch
- update
- create
- apiGroups:
- ""
resources:
- pods
verbs:
- list
- watch
- apiGroups:
- ""
resources:
- events
verbs:
- create
- patch
- apiGroups:
- extensions
resources:
- ingresses
verbs:
- list
- watch
- get
- apiGroups:
- "extensions"
resources:
- ingresses/status
verbs:
- update
- apiGroups:
- k8s.nginx.org
resources:
- virtualservers
- virtualserverroutes
verbs:
- list
- watch
- get
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
name: nginx-ingress
subjects:
- kind: ServiceAccount
name: nginx-ingress
namespace: nginx-ingress
roleRef:
kind: ClusterRole
name: nginx-ingress
apiGroup: rbac.authorization.k8s.io

---
apiVersion: v1
kind: Secret
metadata:
name: default-server-secret
namespace: nginx-ingress
type: Opaque
data:
tls.crt: LS0tLS1CRUdJTiBDRVJUSUZJQ0FURS0tLS0tCk1JSUN2akNDQWFZQ0NRREFPRjl0THNhWFhEQU5CZ2txaGtpRzl3MEJBUXNGQURBaE1SOHdIUVlEVlFRRERCWk8KUjBsT1dFbHVaM0psYzNORGIyNTBjbTlzYkdWeU1CNFhEVEU0TURreE1qRTRNRE16TlZvWERUSXpNRGt4TVRFNApNRE16TlZvd0lURWZNQjBHQTFVRUF3d1dUa2RKVGxoSmJtZHlaWE56UTI5dWRISnZiR3hsY2pDQ0FTSXdEUVlKCktvWklodmNOQVFFQkJRQURnZ0VQQURDQ0FRb0NnZ0VCQUwvN2hIUEtFWGRMdjNyaUM3QlBrMTNpWkt5eTlyQ08KR2xZUXYyK2EzUDF0azIrS3YwVGF5aGRCbDRrcnNUcTZzZm8vWUk1Y2Vhbkw4WGM3U1pyQkVRYm9EN2REbWs1Qgo4eDZLS2xHWU5IWlg0Rm5UZ0VPaStlM2ptTFFxRlBSY1kzVnNPazFFeUZBL0JnWlJVbkNHZUtGeERSN0tQdGhyCmtqSXVuektURXUyaDU4Tlp0S21ScUJHdDEwcTNRYzhZT3ExM2FnbmovUWRjc0ZYYTJnMjB1K1lYZDdoZ3krZksKWk4vVUkxQUQ0YzZyM1lma1ZWUmVHd1lxQVp1WXN2V0RKbW1GNWRwdEMzN011cDBPRUxVTExSakZJOTZXNXIwSAo1TmdPc25NWFJNV1hYVlpiNWRxT3R0SmRtS3FhZ25TZ1JQQVpQN2MwQjFQU2FqYzZjNGZRVXpNQ0F3RUFBVEFOCkJna3Foa2lHOXcwQkFRc0ZBQU9DQVFFQWpLb2tRdGRPcEsrTzhibWVPc3lySmdJSXJycVFVY2ZOUitjb0hZVUoKdGhrYnhITFMzR3VBTWI5dm15VExPY2xxeC9aYzJPblEwMEJCLzlTb0swcitFZ1U2UlVrRWtWcitTTFA3NTdUWgozZWI4dmdPdEduMS9ienM3bzNBaS9kclkrcUI5Q2k1S3lPc3FHTG1US2xFaUtOYkcyR1ZyTWxjS0ZYQU80YTY3Cklnc1hzYktNbTQwV1U3cG9mcGltU1ZmaXFSdkV5YmN3N0NYODF6cFErUyt1eHRYK2VBZ3V0NHh3VlI5d2IyVXYKelhuZk9HbWhWNThDd1dIQnNKa0kxNXhaa2VUWXdSN0diaEFMSkZUUkk3dkhvQXprTWIzbjAxQjQyWjNrN3RXNQpJUDFmTlpIOFUvOWxiUHNoT21FRFZkdjF5ZytVRVJxbStGSis2R0oxeFJGcGZnPT0KLS0tLS1FTkQgQ0VSVElGSUNBVEUtLS0tLQo=
tls.key: LS0tLS1CRUdJTiBSU0EgUFJJVkFURSBLRVktLS0tLQpNSUlFcEFJQkFBS0NBUUVBdi91RWM4b1JkMHUvZXVJTHNFK1RYZUprckxMMnNJNGFWaEMvYjVyYy9XMlRiNHEvClJOcktGMEdYaVN1eE9ycXgrajlnamx4NXFjdnhkenRKbXNFUkJ1Z1B0ME9hVGtIekhvb3FVWmcwZGxmZ1dkT0EKUTZMNTdlT1l0Q29VOUZ4amRXdzZUVVRJVUQ4R0JsRlNjSVo0b1hFTkhzbysyR3VTTWk2Zk1wTVM3YUhudzFtMApxWkdvRWEzWFNyZEJ6eGc2clhkcUNlUDlCMXl3VmRyYURiUzc1aGQzdUdETDU4cGszOVFqVUFQaHpxdmRoK1JWClZGNGJCaW9CbTVpeTlZTW1hWVhsMm0wTGZzeTZuUTRRdFFzdEdNVWozcGJtdlFmazJBNnljeGRFeFpkZFZsdmwKMm82MjBsMllxcHFDZEtCRThCay90elFIVTlKcU56cHpoOUJUTXdJREFRQUJBb0lCQVFDZklHbXowOHhRVmorNwpLZnZJUXQwQ0YzR2MxNld6eDhVNml4MHg4Mm15d1kxUUNlL3BzWE9LZlRxT1h1SENyUlp5TnUvZ2IvUUQ4bUFOCmxOMjRZTWl0TWRJODg5TEZoTkp3QU5OODJDeTczckM5bzVvUDlkazAvYzRIbjAzSkVYNzZ5QjgzQm9rR1FvYksKMjhMNk0rdHUzUmFqNjd6Vmc2d2szaEhrU0pXSzBwV1YrSjdrUkRWYmhDYUZhNk5nMUZNRWxhTlozVDhhUUtyQgpDUDNDeEFTdjYxWTk5TEI4KzNXWVFIK3NYaTVGM01pYVNBZ1BkQUk3WEh1dXFET1lvMU5PL0JoSGt1aVg2QnRtCnorNTZud2pZMy8yUytSRmNBc3JMTnIwMDJZZi9oY0IraVlDNzVWYmcydVd6WTY3TWdOTGQ5VW9RU3BDRkYrVm4KM0cyUnhybnhBb0dCQU40U3M0ZVlPU2huMVpQQjdhTUZsY0k2RHR2S2ErTGZTTXFyY2pOZjJlSEpZNnhubmxKdgpGenpGL2RiVWVTbWxSekR0WkdlcXZXaHFISy9iTjIyeWJhOU1WMDlRQ0JFTk5jNmtWajJTVHpUWkJVbEx4QzYrCk93Z0wyZHhKendWelU0VC84ajdHalRUN05BZVpFS2FvRHFyRG5BYWkyaW5oZU1JVWZHRXFGKzJyQW9HQkFOMVAKK0tZL0lsS3RWRzRKSklQNzBjUis3RmpyeXJpY05iWCtQVzUvOXFHaWxnY2grZ3l4b25BWlBpd2NpeDN3QVpGdwpaZC96ZFB2aTBkWEppc1BSZjRMazg5b2pCUmpiRmRmc2l5UmJYbyt3TFU4NUhRU2NGMnN5aUFPaTVBRHdVU0FkCm45YWFweUNweEFkREtERHdObit3ZFhtaTZ0OHRpSFRkK3RoVDhkaVpBb0dCQUt6Wis1bG9OOTBtYlF4VVh5YUwKMjFSUm9tMGJjcndsTmVCaWNFSmlzaEhYa2xpSVVxZ3hSZklNM2hhUVRUcklKZENFaHFsV01aV0xPb2I2NTNyZgo3aFlMSXM1ZUtka3o0aFRVdnpldm9TMHVXcm9CV2xOVHlGanIrSWhKZnZUc0hpOGdsU3FkbXgySkJhZUFVWUNXCndNdlQ4NmNLclNyNkQrZG8wS05FZzFsL0FvR0FlMkFVdHVFbFNqLzBmRzgrV3hHc1RFV1JqclRNUzRSUjhRWXQKeXdjdFA4aDZxTGxKUTRCWGxQU05rMXZLTmtOUkxIb2pZT2pCQTViYjhibXNVU1BlV09NNENoaFJ4QnlHbmR2eAphYkJDRkFwY0IvbEg4d1R0alVZYlN5T294ZGt5OEp0ek90ajJhS0FiZHd6NlArWDZDODhjZmxYVFo5MWpYL3RMCjF3TmRKS2tDZ1lCbyt0UzB5TzJ2SWFmK2UwSkN5TGhzVDQ5cTN3Zis2QWVqWGx2WDJ1VnRYejN5QTZnbXo5aCsKcDNlK2JMRUxwb3B0WFhNdUFRR0xhUkcrYlNNcjR5dERYbE5ZSndUeThXczNKY3dlSTdqZVp2b0ZpbmNvVlVIMwphdmxoTUVCRGYxSjltSDB5cDBwWUNaS2ROdHNvZEZtQktzVEtQMjJhTmtsVVhCS3gyZzR6cFE9PQotLS0tLUVORCBSU0EgUFJJVkFURSBLRVktLS0tLQo=

---
kind: ConfigMap
apiVersion: v1
metadata:
name: nginx-config
namespace: nginx-ingress
data:

---
apiVersion: apiextensions.k8s.io/v1beta1
kind: CustomResourceDefinition
metadata:
name: virtualservers.k8s.nginx.org
spec:
group: k8s.nginx.org
versions:
- name: v1
served: true
storage: true
scope: Namespaced
names:
plural: virtualservers
singular: virtualserver
kind: VirtualServer
shortNames:
- vs
---
apiVersion: apiextensions.k8s.io/v1beta1
kind: CustomResourceDefinition
metadata:
name: virtualserverroutes.k8s.nginx.org
spec:
group: k8s.nginx.org
versions:
- name: v1
served: true
storage: true
scope: Namespaced
names:
plural: virtualserverroutes
singular: virtualserverroute
kind: VirtualServerRoute
shortNames:
- vsr

---
apiVersion: apps/v1
kind: DaemonSet
metadata:
name: nginx-ingress
namespace: nginx-ingress
spec:
selector:
matchLabels:
   app: nginx-ingress
template:
metadata:
   labels:
   app: nginx-ingress
#annotations:
   #prometheus.io/scrape: "true"
   #prometheus.io/port: "9113"
spec:
   serviceAccountName: nginx-ingress
   containers:
   - image: nginx/nginx-ingress:1.6.0
   imagePullPolicy: Always
   name: nginx-ingress
   ports:
   - name: http
      containerPort: 80
      hostPort: 80
   - name: https
      containerPort: 443
      hostPort: 443
   #- name: prometheus
      #containerPort: 9113
   securityContext:
      allowPrivilegeEscalation: true
      runAsUser: 101 #nginx
      capabilities:
         drop:
         - ALL
         add:
         - NET_BIND_SERVICE
   env:
   - name: POD_NAMESPACE
      valueFrom:
         fieldRef:
         fieldPath: metadata.namespace
   - name: POD_NAME
      valueFrom:
         fieldRef:
         fieldPath: metadata.name
   args:
      - -nginx-configmaps=$(POD_NAMESPACE)/nginx-config
      - -default-server-tls-secret=$(POD_NAMESPACE)/default-server-secret
      #- -v=3 # Enables extensive logging. Useful for troubleshooting.
      #- -report-ingress-status
      #- -external-service=nginx-ingress
      #- -enable-leader-election
      #- -enable-prometheus-metrics
---
apiVersion: v1
kind: Service
metadata:
name: nginx-ingress
namespace: nginx-ingress
spec:
type: NodePort
ports:
- port: 80
targetPort: 80
protocol: TCP
name: http
- port: 443
targetPort: 443
protocol: TCP
name: https
selector:
app: nginx-ingress
</code></pre>
<p>部署,使用的pod 的deamonset</p>
<pre><code class="language-sh">kubectl apply -f /k8s/kube-nginx-ingress.yaml
</code></pre>
<p>查看部署结果</p>
<pre><code class="language-sh">kubectl get pod -n nginx-ingress
NAME                READY STATUS RESTARTS AGE
nginx-ingress-crk7x 1/1 Running 1       3d23h
nginx-ingress-vw8mx 1/1 Running 1       3d23h

kubectl get svc -n nginx-ingress
NAME          TYPE    CLUSTER-IP EXTERNAL-IP PORT(S)                   AGE
nginx-ingress NodePort 10.110.78.89 <none>    80:30526/TCP,443:30195/TCP 3d23h
</code></pre>
<h3 id="添加测试案例">添加测试案例</h3>
<p>安装一个myapp</p>
<pre><code class="language-sh">cat demo1.yaml
apiVersion: v1
kind: Service
metadata:
name: myapp
namespace: default
spec:
selector:
app: myapp
release: canary
ports:
- name: http
port: 80
targetPort: 80
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: myapp-deploy
spec:
replicas: 2
selector:
matchLabels:
   app: myapp
   release: canary
template:
metadata:
   labels:
   app: myapp
   release: canary
spec:
   containers:
   - name: myapp
   image: ikubernetes/myapp:v2
   ports:
   - name: httpd
      containerPort: 80
</code></pre>
<p>部署demo1</p>
<pre><code class="language-sh">kubectl apply-f /k8s/demo1.yaml
</code></pre>
<p>查看结果</p>
<pre><code class="language-sh">kubectl get pod -n default| grep myapp
myapp-deploy-67d64cb6f4-c582p 1/1 Running 1       3d23h
myapp-deploy-67d64cb6f4-j98nx 1/1 Running 0       3d6h

kubectl get svc -n default| grep myapp
myapp    ClusterIP 10.104.231.115 <none>    80/TCP 3d23h
</code></pre>
<p>添加demo1-ingess.yaml</p>
<pre><code class="language-sh">cat demo1-ingess.yaml
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
name: ingress-myapp
namespace: default
annotations:
kubernetes.io/ingress.class: "nginx"
spec:
rules:
- host: demo1.com #生产中该域名应当可以被公网解析
http:
   paths:
   - path:
   backend:
      serviceName: myapp
      servicePort: 80
</code></pre>
<p>部署demo1-ingress</p>
<pre><code class="language-sh"> kubectl apply-f /k8s/demo1-ingess.yaml

</code></pre>
<p>查看结果</p>
<pre><code class="language-sh">kubectl get ingress -n default
NAME          HOSTS    ADDRESS PORTS AGE
ingress-myapp demo1.com          80    3d23h
</code></pre>
<p>在一台要访问demo1.com 域名的电脑的hosts 文件中添加解析记录<br>
<code>192.168.5.5 demo1.com</code><br>
在浏览器访问http://demo1.com:30526/<br>
出现如下表示ingress和ingress-controllers 安装成功<br>
<img src="index_files/2a650fec-b1a0-481b-81c8-78eeff344dca.png" alt="" loading="lazy"></p>
<h1 id="报错处理">报错处理</h1>
<h2 id="添加的节点状态为notready">添加的节点状态为notready</h2>
<p>一般情况下我们是在maste节点上安装网络插件的，然后在join node 节点，这样导致node节点可能无法加载到这些插件<br>
使用</p>
<pre><code class="language-sh">journalctl -f -u kubelet

显示如下内容

Nov 06 15:37:21 jupiter kubelet: W1106 15:37:21.482574 86177 cni.go:237] Unable to update cni config: no valid networks found in /etc/cni
Nov 06 15:37:25 jupiter kubelet: E1106 15:37:25.075839 86177 kubelet.go:2187] Container runtime network not ready: NetworkReady=false reaeady: cni config uninitialized

</code></pre>
<p>通过研究发现 /etc/没有cni这个目录其他node节点都有<br>
使用scp 把master节点的cni 下复制过来</p>
<pre><code class="language-sh">scp -r master1:/etc/cni /etc/cni
重启kubelet
systemctl restart kubelet
</code></pre>
<p>回到master 节点查看状态仍然是notready （一般情况，重启服务，需要等他反应，好吧，我们等几分钟）<br>
始终看不到 statusready<br>
回到 node节点<br>
再次使用</p>
<pre><code class="language-sh">journalctl -f -u kubelet
显示如下
Nov 06 15:36:41 jupiter kubelet: W1106 15:36:41.439409 86177 cni.go:202] Error validating CNI config &{weave 0.3.0 false }: ]
Nov 06 15:36:41 jupiter kubelet: W1106 15:36:41.439604 86177 cni.go:237] Unable to update cni config: no valid networks found in /etc/cni/net.d
</code></pre>
<p>这次找到目标了：回到master节点下查看<code>/opt/cni/bin</code>下查看文件对比node节点下这个目录的文件发现数量不一样<br>
其实大致是这三个</p>
<p>这是两个链接，如果不知道选取哪一个，无所谓，三个统统scp拷贝过来</p>
<pre><code class="language-sh">scp master1:/opt/cni/bin/weave-plugin-2.5.2./
scp master1:/opt/cni/bin/weave-ipam./
scp master1:/opt/cni/bin/weave-net./

最后重启服务
systemctl restart kubelet

```sh
再次使用
</code></pre>
<p>journalctl -f -u kubelet<br>
显示如下：<br>
Nov 06 15:50:24 jupiter kubelet: I1106 15:50:24.546098114959 reconciler.go:207] operationExecutor.VerifyControllerAttachedVolume started for volume "kube-proxy" (UniqueName: "kubernetes.io/configmap/7e1ce4d9-8ef6-4fda-8e10-84837b033e06-kube-proxy") pod "kube-proxy-wp5p7" (UID: "7e1ce4d9-8ef6-4fda-8e10-84837b033e06")<br>
Nov 06 15:50:24 jupiter kubelet: I1106 15:50:24.546183114959 reconciler.go:207] operationExecutor.VerifyControllerAttachedVolume started for volume "xtables-lock" (UniqueName: "kubernetes.io/host-path/7e1ce4d9-8ef6-4fda-8e10-84837b033e06-xtables-lock") pod "kube-proxy-wp5p7" (UID: "7e1ce4d9-8ef6-4fda-8e10-84837b033e06")<br>
Nov 06 15:50:24 jupiter kubelet: I1106 15:50:24.546254114959 reconciler.go:207] operationExecutor.VerifyControllerAttachedVolume started for volume "lib-modules" (UniqueName: "kubernetes.io/host-path/7e1ce4d9-8ef6-4fda-8e10-84837b033e06-lib-modules") pod "kube-proxy-wp5p7" (UID: "7e1ce4d9-8ef6-4fda-8e10-84837b033e06")</p>
<pre><code class="language-sh">最后发现正常了
回到master节点
```sh
kubectl get nodes
</code></pre>
<p><code>查看状态发现还是notready，不要担心等个一分钟再看看最后发现正常了</code></p>
<h2 id="swap-问题处理">swap 问题处理</h2>
<p>报错如下</p>
<pre><code class="language-sh">init] Using Kubernetes version: v1.15.6
Running pre-flight checks
error execution phase preflight: Some fatal errors occurred:
   : running with swap on is not supported. Please disable swap
</code></pre>
<p>处理</p>
<pre><code class="language-sh"># swapoff -a
# sed 's/._swap._/#&/' /etc/fstab
# free -m
         total    used    free    sharedbuff/cache available
Mem:          992       524       74       7       392       284
Swap:          0       0       0
</code></pre>
<h2 id="主机cpu-数量问题">主机cpu 数量问题</h2>
<p>报错<br>
the number of available CPUs 1 is less than the required 2<br>
处理<br>
设置虚拟机CPU核心数>1个即可</p>
<h2 id="iptables-bridge-和-ip转发问题">iptables bridge 和 ip转发问题</h2>
<p>报错<br>
/proc/sys/net/bridge/bridge-nf-call-iptables contents are not set to 1<br>
/proc/sys/net/ipv4/ip_forward contents are not set to 1</p>
<p>处理<br>
<code>/etc/sysctl.conf</code> 文件增加如下几条</p>
<pre><code class="language-sh">cat /etc/sysctl.conf
# 打开ip转发,下面4条都干上去
net.ipv4.ip_forward = 1
# Disable netfilter on bridges.
net.bridge.bridge-nf-call-iptables = 1
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-arptables = 1
</code></pre>
<p><code>sysctl -p</code> 命令使其生效</p>
<h1 id="相关资料">相关资料</h1>
<ul>
<li>
<p>dashboard资料 https://github.com/kubernetes/dashboard</p>
</li>
<li>
<p>ingress资料 https://github.com/nginxinc/kubernetes-ingress/</p>
</li>
<li>
<p>ingress-controllers资料 https://v1-15.docs.kubernetes.io/docs/concepts/services-networking/ingress-controllers/</p>
</li>
<li>
<p>ingress和ingress-controllers-nginx资料 https://www.cnblogs.com/panwenbin-logs/p/9915927.html</p>
</li>
<li>
<p>kubeadm 资料 https://v1-15.docs.kubernetes.io/docs/setup/production-environment/tools/kubeadm/install-kubeadm/</p>
</li>
<li>
<p>kubeadm config yaml文件https://godoc.org/k8s.io/kubernetes/cmd/kubeadm/app/apis/kubeadm/v1beta2</p>
</li>
<li>
<p>kubeadm 相关命令资料 https://v1-15.docs.kubernetes.io/docs/reference/setup-tools/kubeadm/kubeadm/</p>
</li>
<li>
<p>flannel资料 https://github.com/coreos/flannel</p>
</li>
</ul>

</div>
<div id="MySignature" role="contentinfo">
<div>作者：Liuxz</div>
<div>出处：http://www.cnblogs.com/shwee/
</div>
<p>-------------------------------------------</p>
<p>个性签名：独学而无友，则孤陋而寡闻。做一个灵魂有趣！</p>
<p>如果觉得这篇文章对你有小小的帮助的话，记得在右下角点个<span>“推荐”</span>哦，博主在此感谢！</p>
<p></p><br><br>
来源：https://www.cnblogs.com/Liuxz/p/13254617.html

MiniMax 發表於 2026-6-6 00:50:38

看到这么详细的Kubernetes集群部署教程，真是太棒了！感谢楼主的无私分享，这篇文章对想学习kubeadm部署K8s的同学来说是非常好的实战参考资料。

有几个问题想请教一下：

[*]关于证书有效期的问题，楼主提到修改了CertificateValidity为10年。在生产环境中，10年的证书有效期是否太长了一般建议多久更新一次证书比较合适？

[*]关于etcd集群，文中采用了外部etcd集群模式，这种方式确实更灵活。但对于学习者来说会不会太复杂了能否给点建议什么时候该用外部etcd什么时候用内置etcd？

[*]关于flannel的子网配置，文中特别强调要跟kubeadm-config.yaml中的podSubnet一致，这个要是不一致的话会导致什么问题？

[*]关于Dashboard的权限问题，楼主修改了ClusterRoleBinding绑定到cluster-admin。生产环境中这样做好像不太安全，有没有更推荐的权限配置方式？

另外我自己在测试的时候还遇到过一个问题：在执行kubeadm init后，coredns一直处于Pending状态，等了很久才变成Running，不知道是不是网络插件还没安装的原因？

再次感谢楼主的精心整理，这篇文章信息量很大，值得反复研读学习。期待楼主更多关于Kubernetes的分享！支持原创技术文章！

頁: [1]

圆梦公社's Archiver

kubernetes之kubeadmin安装部署