在本文中,我们将回顾如何与Docker一起使用来管理数据库。 在本地运行Docker映像/镜像 首先,我们必须安装Docker Desktop。然后,我们应该从Docker Hub找到我们数据库的现有映像。找到它后,我们将从页面右上角选择docker pull命令。 这里使用PostgreSQL,因此命令为:
$docker pull postgres |
当下载完成后,这个运行命令将创建一个Docker容器内正在运行的数据库。对于PostgreSQL,必须使用-e选项指定POSTGRES_PASSWORD环境变量:
$docker run -e POSTGRES_PASSWORD=password postgres |
jdbc:postgresql://localhost:5432/postgres?user=postgres&password=password |
错误是通知我们该端口未打开。实际上,数据库正在侦听来自容器网络内部的连接,而我们的Java项目正在其外部运行。要修复它,我们需要将容器端口映射到我们的本地主机端口。我们将为PostgreSQL使用默认端口5432:
$docker run -p 5432:5432 -e POSTGRES_PASSWORD=password postgres |
连接现在正在工作,并且我们应该能够使用我们的JDBC数据源。 现在,我们可以从外壳连接到我们的数据库,例如,运行初始化脚本。 首先,让我们找到正在运行的容器ID:
$docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 65d9163eece2 postgres "docker-entrypoint.s…" 27 minutes ago Up 27 minutes 0.0.0.0:5432->5432/tcp optimistic_hellman |
最后,我们可以使用命令行客户端连接到数据库实例,并粘贴我们的SQL脚本:
root@65d9163eece2:/# psql -U postgres postgres=#CREATE DATABASE TEST; CREATE TABLE PERSON( ID INTEGER PRIMARY KEY, FIRST_NAME VARCHAR(1000), LAST_NAME VARCHAR(1000) ); ... |
$docker exec 65d9163eece2 psql -U postgres < dump.sql 使用Docker卷持久化数据 只要我们使用相同的容器,我们的基本设置就可以使用,每次需要重启时,docker容器都会停止/启动。如果再次使用docker run,则会创建一个新的空容器,并且我们将丢失数据。实际上,默认情况下,Docker将数据保留在临时目录中。 现在,我们将学习如何修改此卷映射。 第一项任务是检查我们的容器,以查看数据库使用了哪个卷:
$docker inspect -f "{{ .Mounts }}" 65d9163eece2 [{volume f1033d3 /var/lib/docker/volumes/f1033d3/_data /var/lib/postgresql/data local true }] |
我们可以看到卷f1033d3已将容器目录/ var / lib / postgresql / data映射到在主机文件系统中创建的临时目录/ var / lib / docker / volumes / f1033d3 / _data。
我们必须通过docker run命令中添加-v选项来修改此映射:
$docker run -v C:\docker-db-volume:/var/lib/postgresql/data -e POSTGRES_PASSWORD=password postgres |
现在,我们可以看到在C:\ docker-db-volume目录中创建的数据库文件。我们可以在这篇专门的文章中找到高级卷配置。
另外,我们可能希望在团队成员之间或在不同环境中共享配置。我们可以使用Docker Compose文件,该文件每次都会创建新的容器。在这种情况下,必须使用卷。 下一章将介绍生产环境中Docker数据库的具体用法。 在生产中使用Docker Docker Compose非常适合共享配置并将容器作为无状态服务进行管理。如果服务失败或无法处理工作量,我们可以将Docker Compose配置为自动创建新容器。这对于为REST后端构建生产集群非常有用,该集群在设计上是无状态的。 但是,数据库是有状态的,并且它们的管理更为复杂:让我们回顾一下不同的上下文。 让我们假设我们正在构建一个非关键环境,用于测试或生产,该环境可以容忍停机时间(在部署,备份或故障期间)。 在这种情况下,我们不需要高可用性集群,我们可以简单地将Docker Compose用于单实例数据库:
- 我们可以使用简单的卷进行数据存储,因为容器将在同一台机器上执行
- 我们可以限制它使用全局模式一次运行一个容器
version: '3' services: database: image: 'postgres' deploy: mode: global environment: - POSTGRES_PASSWORD=password ports: - "5432:5432" volumes: - "C:/docker-db-volume:/var/lib/postgresql/data" |
使用此配置,我们的产品将一次仅创建一个容器,并重新使用C:\ docker-db-volume目录中的数据文件。 但是,在此配置中进行定期备份甚至更为重要。如果发生配置错误,该目录可能会被container擦除或破坏。
现在让我们假设我们的生产环境至关重要。 在这种情况下,诸如Docker Swarm和Kubernetes之类的编排工具对于无状态容器是有好处的:它们提供垂直和水平群集,并具有负载平衡,故障转移和自动扩展功能。 不幸的是,由于我们的数据库容器是有状态的,因此这些解决方案没有提供卷复制机制。 另一方面,构建自制配置很危险,因为它可能导致严重的数据丢失。例如:
- 对卷使用NFS或NAS之类的共享存储不能保证在另一个实例中重新启动数据库时不会丢失数据
- 在主从集群上,让Docker业务流程选择多个主节点是一个常见错误,这将导致数据损坏
- 不要将Docker用于数据库,而应实现特定于数据库或硬件的复制机制
- 不要将Docker用于数据库,而订阅OpenShift,Amazon AWS或Azure之类的平台即服务解决方案
- 使用特定于Docker的复制机制,例如KubeDB和Portworx
最后,我们得出结论,当在高可用性环境中使用Docker时,存在缺点。因此,应避免使用它或与专门用于数据库群集的解决方案结合使用。