by Feifei Ruan on Behanceby Feifei Ruan on Behance

2024/06/17:縮減本文篇幅,方便讀者回顧,將「pip 替代方案選擇——Pipenv vs Poetry」相關部分移至 Notion 頁面
2024/03/13:補充範例 repository 作為具體參考。
2024/01/09:重新修訂「名詞解釋」章節。具體說明 Poetry 解決的兩大痛點
2024/01/05:新增「指定套件版本範圍」章節。
2023/12/30:重新修訂「安裝 Poetry」章節。

相關文章:Python 開發環境設定:zsh、zinit、pyenv、Poetry、Docker

前陣子工作上的專案從原先的 pip 改用 Poetry 管理 Python 套件,由於採用 Poetry 正是我的提議,所以得身先士卒,研究 Poetry 使用上的重點與學習成本,並評估是否真有所值——講白了就是至少要利大於弊,不然會徒增團隊適應上的負擔。

拜這個機會所賜,我對 Poetry 總算有了一個較為全面的理解。

習慣後,現在我所有的個人開發也都改用 Poetry 來管理套件及虛擬環境,對於 Poetry 這個略嫌複雜的工具(相較 pip),上手的同時我也感受到它確實存在一些學習門檻,間接促使了本文的誕生。

系列:Python Poetry 三部曲

  1. Python 套件管理器——Poetry 完全入門指南
  2. Poetry + pyenv 教學:常用指令與注意事項
  3. Docker 教學:Dockerfile 多階段建構 Poetry 虛擬環境(待發表)

本文定位:獻給 Poetry 新手的使用說明書

有鑑於 Poetry 真的有點複雜,如果要推薦別人使用,我想還是有必要好好介紹一下。換句話說,這會是一篇完整的入門教學

本文除了講解如何使用 Poetry,還會先不厭其煩地闡述它所解決的痛點,如果對此興趣有限,可以直接跳到「從零開始使用 Poetry」章節,但看完前導部分,相信能更加體會 Poetry 的必要性與強大之處。

為了讓你無痛上手,這將會是一篇超過 8000 字的長文,還請多多擔待。🙏

範例 repository

想要善用 Poetry,除了必須了解 Poetry 指令,熟悉pyproject.toml檔案的設定也很重要。

有關 Poetry 的pyproject.toml具體內容,可以參考這個範例專案:Django-Tutorial 中的pyproject.toml;或直接前往檔案網址

本文目錄

方便快速跳轉到有興趣的部分,桌面版用戶可和右下角的「回到最上方」搭配使用:

  1. Poetry 是什麼?
  2. 名詞解釋
  3. pip 的最大不足
  4. 安裝 Poetry
  5. 設定 PATH 環境變數
  6. 初始化 Poetry
  7. 管理 Poetry 虛擬環境
  8. 修改 config,建立專案內 .venv 虛擬環境
  9. Poetry 新增套件
  10. 指定套件「版本」範圍
  11. 新增套件至 dev-dependencies
  12. Poetry 更新套件
  13. 列出全部套件清單
  14. Poetry 移除套件
  15. 輸出 Poetry 虛擬環境的 requirements.txt
  16. Poetry 常用指令清單
  17. Poetry 常見使用情境與操作 QA
  18. 結語:井然有序的複雜

Poetry 是什麼?

要了解 Poetry 大致的作用與功能,參考 Poetry GitHub 說明是一個不錯的開始:

Poetry: Dependency Management for Python
Poetry helps you declare, manage and install dependencies of Python projects

Poetry 官網的 slogan 則更加簡潔有力:

python-poetry.orgpython-poetry.org

簡單來說,Poetry 類似 pip,能協助你進行套件管理(dependency management),但又比 pip 強大得多,因為它還包含了 pip 所未有的下列功能:

  • 虛擬環境管理
  • 套件相依性管理
  • 套件的打包與發布

其中最為關鍵的是「套件的相依性管理」,也是本文的重點,而「套件的打包與發布」與本文主題無關,所以不會提及。

名詞解釋

開始前,要先大致說明下列三者的區別,才不易混淆文中的內容。這裡的定義可能不盡準確,但至少對理解文中的表達能有所幫助。

虛擬環境管理

指的是使用內建的 venv 或 virtualenv 套件來建立及管理 Python 的虛擬環境,不同的虛擬環境間各自獨立,也就是對應的路徑各不相同。

套件管理(dependency management)

指的是使用 pip 這類的套件管理器來管理 Python 環境(未必是虛擬環境),即管理環境中所安裝的全部套件(package、dependency)及其版本。

在這個語境下,dependency 基本上就是你安裝的套件(package)

套件的「相依性管理」(重要)

這個有點難定義,因為它不是一個很有共識的名詞,我在英文中也難找到對應的單字。這裡指管理套件之間的「依賴關係」及「版本衝突」這兩件事

  1. 依賴關係指的是,當一個套件被安裝時,它所依賴的套件也必須一併安裝(這個很簡單)。反之,當一個套件被移除時,它所依賴的套件也必須一併移除——除非這些套件還被其他套件所依賴(這個就比較複雜了)。
  2. 版本衝突,指的是單一套件被兩個以上的套件所依賴,但不同的套件對依賴的套件有著不同的最低或最高版本要求,若兩者要求的範圍「沒有交集」,則會發生衝突而導致套件失效無法安裝

這兩大問題,都是 pip 所無法解決的,也是 Python 開發上的兩大痛點

而 Poetry 就是為了解決它們而生。


pip 的最大不足

大概在 2 年前就聽過 Poetry 的大名,不過那時我還沒有套件相依性管理的強烈需求,加上看起來需要一些學習成本(確實如此),所以就一直擱在一旁,直到真正體會到了 pip 的不足。

pip 是 Python 內建的套件管理工具,而它的最大罩門,就是對於「套件間的相依性管理」能力不足。尤其是在「移除」套件時的依賴解析——可以說沒有。這也是我提議改用 Poetry 的根本原因。

怎麼說?看完下面的例子就能明白。

pip uninstall的困境:以 Flask 為例

假設現在你的工作專案中有開發 API 的需求,經過一番研究與討論,決定使用 Flask 網頁框架來進行開發。

我們知道,很多套件都有依賴的套件,也就是使用「別人已經造好的輪子」來構成套件功能的一部分。

安裝主套件時,這些依賴套件也必須一併安裝,主套件才能正常運作,這裡的 Flask 就是如此。安裝 Flask 時,不會只安裝單一個flask套件,還會安裝所有 Flask 的必要構成部分——也就是依賴套件,結果如下:

1
2
3
4
5
6
7
❯ pip install flask
Collecting flask
Downloading Flask-2.1.1-py3-none-any.whl (95 kB)
|████████████████████████████████| 95 kB 993 kB/s
...
Installing collected packages: zipp, MarkupSafe, Werkzeug, Jinja2, itsdangerous, importlib-metadata, click, flask
Successfully installed Jinja2-3.1.1 MarkupSafe-2.1.1 Werkzeug-2.1.1 click-8.1.2 flask-2.1.1 importlib-metadata-4.11.3 itsdangerous-2.1.2 zipp-3.7.0

從上可知,pip install flask還會一併安裝importlib-metadataitsdangerous等 7 個依賴套件,實際上總共安裝了 8 個套件!

可以說,pip 在「安裝」套件時的相依性管理還是可以的,這並不難,因為套件的依賴要求都寫在安裝檔裡了,根本不需要「管理」。


附帶一提,這 8 個套件包括flask,除了importlib-metadatazipp外,其餘 6 個實際上都是由 Flask 團隊自行開發

但並非只有 Flask 框架會使用(依賴)這些套件。

比如其中的 Click 就是一個被廣泛使用的命令列製作工具。套件官網是這麼介紹的:

Click is a Python package for creating beautiful command line interfaces in a composable way with as little code as necessary.

別的套件也可能依賴click來提供命令列的功能,換句話說,主套件的依賴套件也可能被其他第三方套件所依賴、使用。這就產生了「衝突」的可能。


好,一切都很美好,就這樣一年過去,團隊決定改用火紅的 FastAPI 取代 Flask 來實作專案的 API,作為 API 的主要開發人員,你對新技術充滿了期待(或排斥),興高采列地安裝了 FastAPI,更新了所有程式碼,最後要移除 Flask,這時問題就來了。

安裝 Flask 的時候,我們只需要pip install flask,pip 就會幫你一併安裝所有依賴套件。現在要移除它,也只要pip uninstall flask就可以了嗎?

很遺憾,答案是否定的

pip 的致命缺陷:缺乏移除套件時的相依性管理

僅執行pip uninstall flask的話,pip 就真的只會幫你移除flask這個套件本身而已。那剩下的、再也用不到的套件怎麼辦?你只能一個一個手動移除!

但你千萬不要真的嘗試手動移除依賴套件!——因為你無法確定這些依賴套件是否同時被別的套件所依賴

也就是 pip 做不到上面「套件的相依性管理」中的第一點移除套件時的相依性管理。(其實第二點也做不到,但這裡先不談)

pip 手動移除依賴套件的潛在風險:以 Flask + Black 為例

繼續以 Flask 為例,還記得其中一個依賴套件是click,如前所述,它是一個協助製作命令列界面的工具。

假設專案中已同時安裝了 Black 這個 formatter,Black 是一個可以透過 CLI 指令執行的格式化工具,剛好,它也是使用click來實作命令列功能。

Black Formatter 相關文章:

我們可以藉由 Poetry 指令來查看,目前這兩個套件的依賴關係狀態

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
black 22.3.0 The uncompromising code formatter.
├── click >=8.0.0
│ └── colorama *
├── mypy-extensions >=0.4.3
├── pathspec >=0.9.0
├── platformdirs >=2
├── tomli >=1.1.0
└── typing-extensions >=3.10.0.0
flask 2.1.2 A simple framework for building complex web applications.
├── click >=8.0
│ └── colorama *
├── importlib-metadata >=3.6.0
│ └── zipp >=0.5
├── itsdangerous >=2.0
├── jinja2 >=3.0
│ └── markupsafe >=2.0
└── werkzeug >=2.0

可以明顯看出,兩者都依賴了click套件

可想而知,移除 Flask 時,如果你同時把click跟著一併手動移除,會發生什麼樣的悲劇——你的 Black 壞了——因為它缺少了必要的依賴套件click


簡言之,直接 pip 手動移除依賴套件存在下列兩大疑慮,不建議輕易嘗試:

一、不確定想移除的套件「有多少依賴套件」

正常而言,你不會去注意安裝時總共一併安裝了多少依賴套件。雖然有pip show這類的指令可以大概知曉套件的依賴,但這指令只會顯示「直接依賴套件」而不會顯示「依賴套件的依賴」,所以列出來的結果未必準確:

1
2
3
4
5
6
7
8
9
10
11
❯ pip show flask
Name: Flask
Version: 2.1.1
Summary: A simple framework for building complex web applications.
Home-page: https://palletsprojects.com/p/flask
Author: Armin Ronacher
Author-email: armin.ronacher@active-4.com
License: BSD-3-Clause
Location: /Users/kyo/.pyenv/versions/3.8.12/envs/test/lib/python3.8/site-packages
Requires: importlib-metadata, Werkzeug, click, Jinja2, itsdangerous
Required-by:

可以看到,Requires:只顯示了 5 個依賴套件,因為剩下的 2 個(zippmarkupsafe)是「依賴的依賴」,在更下層,並未顯示。

二、即使確定依賴套件,也無法確定這些套件「是否還被其他套件所依賴」

好繞口啊!上述的click例子就是解釋這個困境。

小結:pip 只適合小型專案或「只新增不移除」套件的專案

以前我的個人或工作上的專案往往規模不大,pip 就真的只負責新增,鮮少需要考慮移除套件的情況,所以缺少移除套件時的依賴解析,似乎也沒什麼大問題。

但稍具模規的專案往往就需要考慮套件的退場,以維持開發及部署環境的簡潔,尤其在使用容器化部署時,過多不必要的套件會徒增 image 肥大,產生額外的成本與資源浪費不說,同時也提升了「套件之間發生衝突」的可能。

然而透過上述的例子可知,僅靠 pip 想要乾淨移除過時的套件,且不影響既有的套件,簡直是不可能的任務!所以我們需要擁有「完整套件相依性管理功能」的套件管理器。


pip 替代方案選擇——Pipenv vs Poetry

考慮內容時效性與縮減篇幅,本段及「選擇 Poetry 的兩個理由」已移至 Notion

從零開始使用 Poetry

好,漫長的前言到此結束,讓我們進入正題,開始上手學習 Poetry。

2023/04/08:本文最初創作於 Poetry 版本 1.1.19 時期,目前最新版為 1.4.x,部分指令的參數可能略有變動(但不影響理解),請以官方文件為準。

本文主要以 macOS 和 Linux(Ubuntu)環境來進行安裝及教學,Windows 用戶如果有無法順利安裝的情況,建議參考官方文件內容修正。

不過,即使有問題,應該也是集中在安裝與設定階段,其餘部分仍可適用。

安裝 Poetry

2023/12/30:之前把安裝分為「全域」和「pip 安裝」兩種,具有一定誤導性。加上官方文件後來也更新了pipx安裝方式,所以本段重新修訂。

Poetry 和 pip、git、pyenv 等工具一樣,都是典型的命令列工具,需要先安裝才能下達指令——poetry

安裝方式選擇

Poetry 是一個 Python 套件,需要有 Python 執行環境才能正常運行。

Poetry 提供了兩種主要的安裝方式

  1. 使用pipx安裝。
  2. 使用 official installer(即下述的安裝指令)安裝。

以上兩種方式大同小異,核心內涵都是「自動為你建立一個 Python 虛擬環境,並在其中安裝 Poetry」,以達到 Poetry 安裝環境的獨立與隔離

如果你平常沒在使用 pipx,那選擇第二種方式即可。

避免安裝 Poetry 至專案虛擬環境

安裝 Poetry 的時候,一定將它安裝在一個「專用」的虛擬環境。上述兩種安裝方式都滿足這個條件。

千萬不要為了方便,把 Poetry 直接安裝至你的專案虛擬環境,這麼做是危險的

因為 Poetry 所依賴的套件非常多,總計超過 30 個,會嚴重影響專案虛擬環境的整潔度。這些依賴套件可能和專案本身的套件發生衝突

所以官方文件才會提醒你:

Poetry should always be installed in a dedicated virtual environment to isolate it from the rest of your system. In no case, it should be installed in the environment of the project that is to be managed by Poetry.


使用 official installer 安裝 Poetry 至家目錄

我個人使用 official installer 安裝。

要用 official installer 安裝 Poetry,只要在命令列輸入下列指令。

macOS / Linux / WSL(Windows Subsystem for Linux)

1
curl -sSL https://install.python-poetry.org | python3 -

Windows

1
(Invoke-WebRequest -Uri https://install.python-poetry.org -UseBasicParsing).Content | python -

Poetry 實際安裝路徑如下:

The installer installs the poetry tool to Poetry’s bin directory. This location depends on your system:

  • $HOME/.local/bin for Unix
  • %APPDATA%\Python\Scripts on Windows

以 macOS 為例,如果要下poetry指令,就需要打完整路徑$HOME/.local/bin/poetry,顯然不太方便,所以我們需要設定 PATH。


設定 PATH 環境變數

如果你選擇pipx安裝 Poetry,原則上不需要設定 PATH,因為pipx會自動幫你設定——難怪官方把pipx安裝方式放在分頁的首位。

如果你選擇「official installer 安裝」,那這一步非常重要,我們必須先「手動設定」PATH,否則作業系統不知道poetry指令的執行檔在哪,根本無法使用

至於 PATH 是什麼,可以參考良葛格這篇〈PATH 是什麼?〉。

總之,我們要將poetry執行檔所在的路徑(目錄)新增至 PATH。

在 macOS 或 Linux 上設定 PATH

使用 macOS 或 Linux,設定 PATH 的步驟相對簡單,只要在.zshrc.bashrc.bash_profile新增:

1
export PATH=$PATH:$HOME/.local/bin

存檔後重啟 shell 即可使用。直接在命令列打上poetry指令測試。

在 Windows 上設定 PATH

Windows 用戶可參考 JetBrains 的 Poetry 設定教學。我覺得寫得比 Poetry 官方文件更好懂:

1
$Env:Path += ";C:\Users\jetbrains\AppData\Roaming\Python\Scripts"; setx PATH "$Env:Path"

注意,上面的路徑要替換成你自己的使用者路徑——肯定不是jetbrains

Don’t forget to replace jetbrains with your username!

設定完後,重啟 shell,一樣,可直接在命令列打上poetry指令測試。

設定 alias

比起pippoetry這個指令實在太冗長了!我們還是給它一個 alias 吧!

基於它是我極為常用的指令,我願意賦與它「單字母」的 alias 特權,我使用p

1
alias p='poetry'

alias 是方便自己使用,但本文基於表達清晰考量,下面的解說除了圖片外,原則上並不會使用 alias 表示。


初始化 Poetry

為了方便解說,我們先建立一個全新的專案,名為poetry-demo

指令都很簡單,但還是建議可以一步一步跟著操作。

就像 git 專案需要初始化,Poetry 也需要,因為每一個使用了 Poetry 的專案中一定要有一個pyproject.toml作為它的設定檔。否則直接使用poetry相關指令就會出現下列錯誤訊息:

Poetry could not find a pyproject.toml file in {cwd} or its parents

所以一定先初始化,使用poetry init

1
2
3
mkdir poetry-demo
cd poetry-demo
poetry init

此時會跳出一連串的互動對話,協助你建立專案的資料,大部分可以直接enter跳過:

1
2
3
4
5
6
7
8
9
10
This command will guide you through creating your pyproject.toml config.

Package name [poetry-demo]:
Version [0.1.0]:
Description []:
Author [kyo <odinxp@gmail.com>, n to skip]:
License []:
Compatible Python versions [^3.8]:

Would you like to define your main dependencies interactively? (yes/no) [yes]

直到出現「Would you like to define your main dependencies interactively? (yes/no) [yes]」,我們先選擇「no」後,會讓你確認本次產生的toml檔內容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Would you like to define your development dependencies interactively? (yes/no) [yes] no
Generated file

[tool.poetry]
name = "poetry-demo"
version = "0.1.0"
description = ""
authors = ["kyo <odinxp@gmail.com>"]

[tool.poetry.dependencies]
python = "^3.8"

[tool.poetry.dev-dependencies]

[build-system]
requires = ["poetry-core>=1.0.0"]
build-backend = "poetry.core.masonry.api"

並詢問你「Do you confirm generation? (yes/no) [yes]」,按enter使用預設選項「yes」或直接回答「yes」,則pyproject.toml建立完成。

此時專案目錄結構如下:

1
2
3
4
poetry-demo
└── pyproject.toml

0 directories, 1 file

管理 Poetry 虛擬環境

我覺得學習 Poetry 的第一道關卡,就是它對於虛擬環境的管理。

「強制」虛擬環境

Poetry 預設上(可透過poetry config修改)會強制套件都要安裝在虛擬環境中,以免污染全域,所以它整合了virtualenv

所以在執行poetry add、install等指令時,Poetry 都會自動檢查當下是否正在使用虛擬環境:

  • 如果,則會直接安裝套件至當前的虛擬環境。
  • 如果,則會自動幫你建立一個新的虛擬環境,再進行套件安裝。

容易混淆的虛擬環境

Poetry 主動納入虛擬環境管理算是立意良善,相當於把pip+venv兩者的功能直接整合在一起,但也帶來一定的複雜度,尤其在你已經自行使用了venvvirtualenvpyenv-virtualenvconda等工具來管理虛擬環境的情況下!

沒錯,Python 的虛擬環境管理就是這麼麻煩!

個人建議,對新手而言,於 Poetry 的專案中,一律透過 Poetry 來管理虛擬環境即可。我目前也是這樣,省得麻煩。

以指令建立虛擬環境

使用指令poetry env use python

1
2
3
❯ poetry env use python
Creating virtualenv poetry-demo-IEWSZKSE-py3.8 in /Users/kyo/Library/Caches/pypoetry/virtualenvs
Using virtualenv: /Users/kyo/Library/Caches/pypoetry/virtualenvs/poetry-demo-IEWSZKSE-py3.8

可以看出 Poetry 為我們建立了名為poetry-demo-IEWSZKSE-py3.8的虛擬環境。

重點說明

  • poetry env use python建立虛擬環境所使用的 Python 版本,取決於python指令在你的「PATH」是連結到哪個版本。
    • 你也可以將指令最後的python,改為python3python3.8,甚至只需要3.8,只要它們確實存在於 PATH 中。
    • 更多資訊可參考官方文件
  • 預設上,Poetry 會統一將虛擬環境建立在「特定目錄」裡,比如本例中存放的路徑是/Users/kyo/Library/Caches/pypoetry/virtualenvs
  • 虛擬環境的命名模式為專案名稱-亂數-Python版本

最後一點,老實說我個人不是很喜歡這樣的做法,因為這意味著單一專案允許建立複數個虛擬環境(比如 Python 3.7、3.8、3.9 可以各來一個),彈性之餘也增加了混亂的可能,而且這命名模式我也不太欣賞,顯得有點冗長。

既然 Python 的虛擬環境理論上都是高度綁定專案本身的,我更偏好venv式的做法,也就是把虛擬環境放到專案目錄內,而非統一放在獨立的目錄,讓虛擬環境與專案呈現直觀的一對一關係

所幸,Poetry 具備這樣的選項。


修改config,建立專案內.venv虛擬環境

我們先使用poetry config指令來查看 Poetry 目前幾個主要的設定,需要--list這個參數:

1
2
3
4
5
6
7
❯ poetry config --list
cache-dir = "/Users/kyo/Library/Caches/pypoetry"
experimental.new-installer = true
installer.parallel = true
virtualenvs.create = true
virtualenvs.in-project = false
virtualenvs.path = "{cache-dir}/virtualenvs"

其中virtualenvs.create = true若改成false,則可以停止 Poetry 在「偵測不到虛擬環境時會自行建立」的行為模式,但建議還是不要更動。

virtualenvs.in-project = false就是我們要修改的目標,使用指令:

1
poetry config virtualenvs.in-project true

好,我們先把之前建立的虛擬環境刪除:

1
2
❯ poetry env remove python
Deleted virtualenv: /Users/kyo/Library/Caches/pypoetry/virtualenvs/poetry-demo-IEWSZKSE-py3.8

重新建立,看看行為有何差異:

1
2
3
❯ poetry env use python
Creating virtualenv poetry-demo in /Users/kyo/Documents/code/poetry-demo/.venv
Using virtualenv: /Users/kyo/Documents/code/poetry-demo/.venv

可以看出:

  • 虛擬環境的路徑改為「專案的根目錄」。
  • 名稱固定為.venv

我覺得這樣的設定更加簡潔。

啟動與退出虛擬環境

啟動虛擬環境,需移至專案目錄底下,使用指令poetry shell

1
2
3
❯ poetry shell
Spawning shell within /Users/kyo/Documents/code/poetry-demo/.venv
❯ . /Users/kyo/Documents/code/poetry-demo/.venv/bin/activate

poetry shell指令會偵測當前目錄或所屬上層目錄是否存在pyproject.toml來確定所要啟動的虛擬環境,所以如果不移至專案目錄,則會出現下列錯誤:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
❯ poetry shell

RuntimeError

Poetry could not find a pyproject.toml file in /Users/kyo/Documents/code or its parents

at ~/Library/Application Support/pypoetry/venv/lib/python3.8/site-packages/poetry/core/factory.py:369 in locate
365│ if poetry_file.exists():
366│ return poetry_file
367│
368│ else:
→ 369│ raise RuntimeError(
370│ "Poetry could not find a pyproject.toml file in {} or its parents".format(
371│ cwd
372│ )
373│ )

可以看到,Poetry 的錯誤訊息非常清楚,讓你很容易知曉修正的方向,這是作為一個優秀命令列工具的必要條件。

退出就簡單多了,只需要exit即可。


Poetry 指令

Poetry 是一個獨立的命令列工具,就像 pyenv,它有自己的指令,需要花費額外的心力學習,且較 pip 更加複雜,這可能是使用 Poetry 的第二道關卡。好在常用的指令,其實也不超過 10 個,下面就來一一介紹。

在此我們繼續使用前面提過的 Flask 和 Black 套件,來示範並說明 Poetry 的優勢以及它和 pip 的不同之處。

Poetry 新增套件

使用指令:

1
poetry add

相當於pip install,我們來試著安裝 Flask 看看會有什麼變化:

圖中可以看出 Poetry 漂亮的命令列資訊呈現,會清楚告知總共新增了幾個套件。

此時專案中的pyproject.toml也會發生變化:

1
2
3
4
5
6
7
8
9
...
[tool.poetry.dependencies]
python = "^3.8"
Flask = "^2.1.1" # 新增部分

[tool.poetry.dev-dependencies]

[build-system]
...

這裡要說明,安裝 Flask,則pyproject.toml就只會新增記載Flask = "^2.1.1"這個 top-level 的 package 項目,其餘的依賴套件不會直接記錄在toml檔中。

我覺得這是一大優點,方便區分哪些是你主動安裝的主要套件,而哪些又是基於套件的依賴關係而一併安裝的依賴套件。

poetry.lock與更新順序

除了更新pyproject.toml,此時專案中還會新增一個檔案,名為poetry.lock,它實際上就相當於 pip 的requirements.txt,詳細記載了所有安裝的套件與版本。

當你使用poetry add指令時,Poetry 會自動依序幫你做完這三件事

  1. 更新pyproject.toml
  2. 依照pyproject.toml的內容,更新poetry.lock
  3. 依照poetry.lock的內容,更新虛擬環境。

由此可見,poetry.lock的內容是取決於pyproject.toml,但兩者並不會自己連動,一定要基於特定指令才會進行同步與更新,poetry add就是一個典型案例。

此時專案目錄結構如下:

1
2
3
4
5
poetry-demo
├── poetry.lock
└── pyproject.toml

0 directories, 2 files

poetry lock:更新 poetry.lock

當你自行修改了pyproject.toml內容,比如變更特定套件的版本(這是有可能的,尤其在手動處理版本衝突的時候),此時poetry.lock的內容與pyproject.toml出現了「脫鉤」,必須讓它依照新的pyproject.toml內容更新、同步,使用指令:

1
poetry lock

如此一來,才能確保手動修改的內容,也更新到poetry.lock中,畢竟虛擬環境如果要重新建立,是基於poetry.lock的內容來安裝套件,而非pyproject.toml

還是那句話:

poetry.lock相當於 Poetry 的requirements.txt

但要特別注意的是,poetry lock指令,僅會更新poetry.lock「不會」同時安裝套件至虛擬環境:

This command locks (without installing) the dependencies specified in pyproject.toml.

因此,在執行完poetry lock指令後,你必須再使用poetry install來安裝套件。否則就會出現poetry.lock和虛擬環境不一致的狀況。

更多poetry lock細節可參考官方文件,其中特別值得注意的是--no-update參數。


指定套件「版本」範圍

2024/01/05新增。

回想我們使用 pip 的時候,requirements.txt的內容通常是長這樣:

1
2
3
4
5
6
blinker==1.6.3
click==8.1.7
flask==3.0.0
itsdangerous==2.1.2
jinja2==3.1.2
...

所有套件的版本都是固定的!

如前所述,那是因為 pip 並不擅長管理套件的版本衝突,所以固定是最保險的。但代價是,專案無法輕易更新套件版本,容易過時,造成後續開發與維護的麻煩

你可以試著手動修改requirements.txt,但隨之而來的是一陣陣手動處理版本衝突的痛苦😱

Poetry 的版本管理能力

使用 Poetry,情況將大不相同,因為 Poetry 能夠管理套件的版本衝突,所以我們可以放心地透過「範圍」來指定套件的版本。

這樣的好處是,在不影響專案穩定性(不發生套件版本衝突)的前提下,自動更新套件至範圍內的最新版,且不需要手動修改pyproject.toml

當然,如果你認為這不夠保險,還是可以在安裝時,指定套件的「特定」版本。或後續手動修改pyproject.toml,讓套件版本固定。

Poetry 的add指令,可以用下列方式指定套件版本(前二者須搭配@運算子),我們以安裝 Django 4.2 LTS 為例。

一、使用^符號(文件

指定 Django 版本為 >=4.2.9 且 <5.0.0(允許 4.2.9 及以上版本,但不包括 5.0.0,即最大版號不能變更):

1
poetry add django@^4.2.9

這意味著它會接受所有 4.x.x 的更新,只要版本號小於 5.0.0。這是一個常見的做法,因為它允許套件自動更新到任何非重大變更的新版本。

二、使用~符號(文件

指定 Django 版本為 >=4.2.9 且 <4.3.0(允許 4.2.9 及以上版本,但不包括 4.3.0,即只能升級最小版號):

1
poetry add django@~4.2.9

這個選項更加保守只會接受 4.2.x 系列的更新。這適合想要進一步限制更新的範圍,但又保留一些更新的彈性——僅包括 bug 修正和小幅度的改進。

三、使用>=符號

指定 Django 版本為 >=4.2.9(沒有上限):

1
2
# 注意,這裡需要使用「字串」表示
poetry add "django>=4.2.9"

主版號(即上面的 4.x.x 中的 4)升級時,通常有更大機率引入 API 變更、棄用舊有的 API 等,也就是所謂的 breaking change。

這樣的更新可能會導致你的專案無法正常運作,需要一併修改程式碼。所以一般不建議使用這種方式。

四、固定版本

僅允許 Django 的 4.2.9 版本(嚴格限制在這個版本):

1
poetry add django==4.2.9

安全、保險,但也浪費了 Poetry 的版本管理能力。

一般我只在 linter、formatter 等工具上使用固定版本,自己手動更新。因為它們必須和 pre-commit 設定檔中的版本一致。所以我不會讓它們自動升級。


依我個人經驗,最常用的是第 1 和第 4 種方式。

一次安裝複數套件

Poetry 的add指令,也可以一次安裝複數套件,比如:

1
poetry add django@^4.2.9 requests@^2.26.0

或不指定版本:

1
poetry add django requests

新增套件至 dev-dependencies

有些套件,比如pytestflake8等等,只會在開發環境中使用,產品的部署環境並不需要。

Poetry 允許你區分這兩者,將上述的套件安裝至dev-dependencies區塊,方便讓你輕鬆建立一份「不包含」dev-dependencies開發套件的安裝清單

在此以 Black 為例,安裝指令如下,舊版

1
2
3
poetry add black --dev
# 或
poetry add black -D

新版,Poetry >= 1.2.0

1
2
3
poetry add black --group dev
# 或
poetry add black -G dev

結果的區別顯示在pyproject.toml裡:

1
2
3
4
5
6
7
8
...
[tool.poetry.dependencies]
python = "^3.8"
Flask = "^2.1.1"

[tool.poetry.dev-dependencies]
black = "^22.3.0"
...

可以看到black被列在不同區塊:tool.poetry.dev-dependencies

強烈建議善用 dev-dependencies

善用-D參數,明確區分開發環境專用的套件,我認為非常必要

首先,這些套件常常屬於「檢測型」工具,相關的依賴套件著實不少!比如flake8,它依賴了pycodestylepyflakesmccabe等等,還有blackpre-commit,依賴套件數量也都很可觀。

其次,既然它們都只在開發階段才需要,則完全可以從部署環境中缺席。如果不分青紅皂白一律安裝到dependencies區塊,部署環境容易顯得過於臃腫

常見的dev-dependencies區塊項目,例示如下:

1
2
3
4
5
6
7
8
9
[tool.poetry.dev-dependencies]
flake8 = "4.0.1"
yapf = "0.32.0"
pytest = "7.1.2"
pytest-django = "4.5.2"
pytest-cov = "3.0.0"
pytest-env = "0.6.2"
pytest-sugar = "0.9.4"
pre-commit = "2.20.0"

Poetry 更新套件

這個就很簡單了,使用poetry update指令即可:

1
poetry update

上面指令會更新全部可能可以更新」的套件,你也可以僅指定特定套件,比如:

1
poetry update requests toml

關於poetry update的其餘參數,請參考文件

還一件重要的事,那就是關於套件版本的升級限制規則,取決於你在pyproject.toml中的設定。

這部分稍嫌複雜,且有多種表達方式,可見 Dependency specification


列出全部套件清單

類似pip list,這裡要使用poetry show

1
2
3
4
5
6
7
8
9
10
11
12
❯ poetry show
black 22.3.0 The uncompromising code formatter.
click 8.1.3 Composable command line interface toolkit
flask 2.1.2 A simple framework for building complex web applications.
importlib-metadata 4.11.4 Read metadata from Python packages
itsdangerous 2.1.2 Safely pass data to untrusted environments and back.
jinja2 3.1.2 A very fast and expressive template engine.
markupsafe 2.1.1 Safely add untrusted strings to HTML/XML markup.
mypy-extensions 0.4.3 Experimental type system extensions for programs checked...
pathspec 0.9.0 Utility library for gitignore style pattern matching of ...
platformdirs 2.5.2 A small Python module for determining appropriate platfo...
...

特別提醒的是,這裡的清單內容並不是來自於虛擬環境,這點和 pip 不同,而是來自於poetry.lock的內容。

你可能會想,來自於poetry.lock或虛擬環境,有差嗎?兩者不是應該要一致?

沒錯,理論上是,但也有不一致的時候,比如你使用了pip install指令安裝套件,就不會記載在poetry.lock中,那poetry show自然也不會顯示。

「樹狀」顯示套件依賴層級

Poetry 最為人津津樂道的就是它的樹狀顯示——poetry show --tree

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
❯ poetry show --tree
flask 2.1.1 A simple framework for building complex web applications.
├── click >=8.0
│ └── colorama *
├── importlib-metadata >=3.6.0
│ └── zipp >=0.5
├── itsdangerous >=2.0
├── jinja2 >=3.0
│ └── markupsafe >=2.0
└── werkzeug >=2.0
black 22.3.0 The uncompromising code formatter.
├── click >=8.0.0
│ └── colorama *
├── mypy-extensions >=0.4.3
├── pathspec >=0.9.0
├── platformdirs >=2
├── tomli >=1.1.0
└── typing-extensions >=3.10.0.0

讓主要套件與其依賴套件的關係與層次,一目了然

而且很貼心的是,它也可以只顯示「指定套件」的依賴層級,以celery為例:

1
2
3
4
5
6
7
8
9
10
11
❯ poetry show celery --tree
celery 4.4.0 Distributed Task Queue.
├── billiard >=3.6.1,<4.0
├── kombu >=4.6.7,<4.7
│ ├── amqp >=2.6.0,<2.7
│ │ └── vine >=1.1.3,<5.0.0a1
│ └── importlib-metadata >=0.18
│ ├── typing-extensions >=3.6.4
│ └── zipp >=0.5
├── pytz >0.0-dev
└── vine 1.3.0

Poetry 移除套件

使用poetry remove指令。和poetry add一樣,可以加上-D參數來移除置於開發區的套件。

而移除套件時的「依賴解析(相依性管理)」能力,正是 Poetry 遠優於 pip 的主要環節,因為 pip 沒有嘛!也是我提議改用 Poetry 的關鍵理由——為了順利移除套件

前面已經提過,pip 的pip uninstall只會移除你所指定的套件,而不會連同依賴套件一起移除。

這是基於安全考量,因為 pip 沒有「依賴解析」功能。如果貿然移除所有「安裝時一併安裝」的依賴套件,可能會造成巨大災難,讓別的套件失去效用。

前面也舉了 Flask 和 Black 都共同依賴click這個套件的例子,在手動移除套件的情況下,你可能未曾注意 Black 也依賴了click,結果為了「徹底移除」Flask 的所有相關套件,不小心把click也移除掉了。

所以,使用 pip 時,我們鮮少會去移除已經不再使用的套件。畢竟依賴關係錯綜複雜,移除套件可能造成許多「副作用」,實在是太麻煩了。

poetry remove的依賴解析

好,解釋了很多,接下來就是 Poetry 的表演了,它會幫你處理這些棘手的「套件相依性」難題,讓你輕鬆移除 Flask 而不影響 Black:

poetry remove flaskpoetry remove flask

可以對比上面安裝 Flask 時的截圖,那時總共安裝了 8 個套件,但現在移除的卻只有 7 個——沒錯,因為有依賴解析,Poetry 知道 Black 還需要click!所以不能移除:

1
2
3
4
5
6
7
8
9
❯ poetry show --tree
black 22.3.0 The uncompromising code formatter.
├── click >=8.0.0
│ └── colorama *
├── mypy-extensions >=0.4.3
├── pathspec >=0.9.0
├── platformdirs >=2
├── tomli >=1.1.0
└── typing-extensions >=3.10.0.0

一個套件直到環境中的其餘套件都不再依賴它,Poetry 才會安心讓它被移除。


輸出 requirements.txt

理論上,全面改用 Poetry 後,專案中是不需要存在requirements.txt,因為它的角色已經完全被poetry.lock所取代。

但事實是,你可能還是需要它,甚至希望它隨著poetry.lock的內容更新!至少對我而言就是如此,我在 Docker 部署環境中並不使用 Poetry,所以我需要一份完全等價於poetry.lockrequirements.txt用於 Docker 部署。

你可能想說,那我就在 Poetry 的虛擬環境下,使用以往熟悉的指令pip freeze > requirements.txt來產生一份就可以了吧?我本來也是這麼想,但實際的產出卻是如此:(提醒:目前 poetry-demo 專案中僅剩下 Black 和它的依賴套件

1
2
3
4
black @ file:///Users/kyo/Library/Caches/pypoetry/artifacts/11/4c/fc/cd6d885e9f5be135b161e365b11312cff5920d7574c8446833d7a9b1a3/black-22.3.0-cp38-cp38-macosx_10_9_x86_64.whl
click @ file:///Users/kyo/Library/Caches/pypoetry/artifacts/f0/23/09/b13d61d1fa8b3cd7c26f67505638d55002e7105849de4c4432c28e1c0d/click-8.1.2-py3-none-any.whl
mypy-extensions @ file:///Users/kyo/Library/Caches/pypoetry/artifacts/b6/a0/b0/a5dc9acd6fd12aba308634f21bb7cf0571448f20848797d7ecb327aa12/mypy_extensions-0.4.3-py2.py3-none-any.whl
...

這呈現好像不是我們以前熟悉的那樣:

1
2
3
4
black==22.3.0
click==8.1.2
mypy_extensions==0.4.3
...

沒錯,只要是使用poetry add安裝的套件,在pip freeze就會變成這樣。此時想輸出類似requirements.txt的格式,需要使用poetry export

預設的輸出結果會有 hash 值,很干擾閱讀。不想納入 hash 則要加上參數去除。以下就是我固定用來輸出requirements.txt的指令與參數:

1
poetry export -f requirements.txt -o requirements.txt --without-hashes

2022/08/24補充:網友提醒,hash 有其價值,並建議保留,詳見留言區

我們再看一下輸出結果,雖然不盡相同,但也相去不遠了……嗎?等等,怎麼是空白?

輸出 dev-dependencies

因為poetry export預設只會輸出toml中的[tool.poetry.dependencies]區塊的套件!還記得上面我們把 Black 安裝到[tool.poetry.dev-dependencies]了嗎?

顯然 Poetry 認為你 export 基本上就為了部署,並不需要開發區的套件。

這倒是沒錯,不過基於演示需求,我們必須輸出[tool.poetry.dev-dependencies]的套件,才能看到 Black。

加上--dev參數即可(新版須使用--with dev參數):

1
poetry export -f requirements.txt -o requirements.txt --without-hashes --dev

輸出的requirements.txt內容:

1
2
3
4
black==22.3.0; python_full_version >= "3.6.2"
click==8.1.2; python_version >= "3.7" and python_full_version >= "3.6.2"
colorama==0.4.4; python_version >= "3.7" and python_full_version >= "3.6.2" and platform_system == "Windows"
...

雖然長得有點不一樣,但這個檔案確實是可以pip install的。

從這裡也可以看出先前一再提及「區分開發、部署套件」的價值——大部分時候我們並不需要輸出開發用套件。

poetry export所有參數用法與說明,請參考文件

此時專案目錄結構如下:

1
2
3
4
5
6
poetry-demo
├── poetry.lock
├── pyproject.toml
└── requirements.txt

0 directories, 3 files

Poetry 常用指令清單

算來算去,Poetry 的常用指令主要有下面幾個:

  • poetry add
  • poetry remove
  • poetry export
  • poetry env use
  • poetry shell
  • poetry show
  • poetry init
  • poetry install

其中一半,單一專案可能只會用個一兩次而已,比如initinstallenv use,實際上需要學習的指令並不多。

那麼,只要知曉這些指令,就可以順利運用 Poetry 了嗎?可能是,也可能否,所以我下面還會再補充 Poetry 的常見使用情境與操作方式,讓你接納 Poetry 的阻力可以進一步下降!


Poetry 常見使用情境與操作 QA

這部分會以「使用場景」的角度切入,介紹 Poetry 應用情境與操作說明,還包括一些自問自答:

  1. 新增專案並使用 Poetry
  2. 現有專案改用 Poetry
  3. 在別台主機上重現專案的 Poetry 虛擬環境
  4. 我想要移除並重建虛擬環境
  5. 為什麼我不在 Docker 環境中使用 Poetry?
  6. 我可以使用自己習慣的 virtualenv 嗎?

一、新增專案並使用 Poetry

這是最理想的狀態,沒有過去的「包袱」,可謂是最能輕鬆採用 Poetry 的情境。

使用順序不外乎是:

  1. poetry init:初始化,建立pyproject.toml
  2. poetry env use python:建立專案虛擬環境並使用。
  3. poetry shell:進入專案但虛擬環境還未啟動,以這個指令啟動。如果使用本指令時虛擬環境尚未建立或已移除,則會直接自動幫你建立虛擬環境並使用。
  4. poetry add:安裝套件並寫入虛擬環境。必要時使用-D參數,使其安裝至 dev 區塊。
  5. poetry remove:移除套件,若是移除 dev 區塊的套件,需要加上-D參數。

這部分和前面內容沒有差別,因為前面內容就是以全新專案作為基礎。

二、現有專案改用 Poetry

極為常見的需求,但並沒有很正式的做法,因為不存在poetry import之類的指令。

首先要考量的就是:要怎麼把requirements.txt的所有項目加到pyproject.toml中呢?經過一番 Google,基本上只能土法煉鋼

1
cat requirements.txt | xargs poetry add

然而這樣做是有可能遇到一些問題的,因為 Poetry 對套件的版本衝突比較敏感,所以即便用pip install -r requirements.txt都能正常安裝,透過上述指令的遷移過程卻仍有機會出現錯誤。

那怎麼辦?只能照著錯誤訊息手動修正requirements.txt中的套件版本。

只能說這個「手動 import」做法實在是不得已,因為我們最早介紹pyproject.toml時有提到,poetry add只會在pyproject.toml中寫入「主套件」,但這樣的 import 方式相當於把requirements.txt中的所有套件,都當作主套件add了!

畢竟在requirements.txt無從區分主套件與依賴套件,都是「一視同仁」地列出。

但如此做法也讓專案的套件失去主從之分,這樣會有什麼壞處?日後要移除主套件時,需要花額外的心力去區分主從(因為僅僅移除依賴套件並不會有移除效果),比如使用poetry show --tree去一個一個檢視,終究是件麻煩事。

完成轉換後,為保險起見,建議透過新的pyproject.toml來重建一個虛擬環境。

三、在別台主機上重現專案的 Poetry 虛擬環境

這也是非常常見的需求。

第一步當然是git clone專案,此時專案中已經有 Poetry 所需的必要資訊了——也就是pyproject.tomlpoetry.lock

你還缺少的僅僅是虛擬環境。如果是全新的主機,則還得先安裝、設定好 Poetry。

確定 Poetry 可正常使用後,移至專案目錄底下,依序執行指令:

  1. poetry env use python:建立專案虛擬環境並使用。如果你懶得打這麼長的指令,直接poetry shell也是可以。此時我們會有一個「空的」虛擬環境。
  2. poetry install:因為是舊專案,不需要init,會直接依poetry.lock記載的套件版本安裝到虛擬環境中!類似npm install

四、我想要移除並重建虛擬環境

在使用「專案內虛擬環境」方案,也就是.venv的前提下,想要刪除這個虛擬環境並加以重建,不能使用poetry env remove python指令,很可能會出錯。

不過有更簡單的做法——直接刪除.venv資料夾即可。

然後再poetry env use pythonpoetry shell建一個新的就好。

五、為什麼我不在 Docker 環境中使用 Poetry?

因為啟動容器後需要先安裝 Poetry 到全域,或打包一個帶有 Poetry 的 image,兩者都會增加新的耦合與依賴,我覺得並不妥當。

2023/02/24補充:使用 multi-stage builds 的 Dockerfile,可以在第一階段安裝 Poetry,第二階段再把 Poetry 捨棄,這樣就不會有多餘的耦合與依賴了。日後會專文介紹。

所幸 Poetry 依舊可以輸出requirements.txt,Docker 部署環境就繼續使用這個舊方案即可,而且 Poetry 本來主要就是用於「開發」時的套件管理,對部署差別不大。

六、我可以使用自己習慣的 virtualenv 嗎?

當然可以。

不過我本來也繼續使用pyenvvirtualenv,但兩者有時候也是會小小打架,後來還是索性用 Poetry 的虛擬環境就好。

一個專案對應一個虛擬環境,應該還是比較簡潔的做法,我的觀察啦!😎


結語:井然有序的複雜

總的來說,Poetry 是一款優秀的套件管理工具,但並不像 pip 那般簡單、好上手。

使用 Poetry 來管理專案的套件與虛擬環境,需要一定的學習成本,但帶來的效益還是相當可觀的,尤其在你希望能夠乾淨且安心地移除套件之際,可謂莫它莫屬。

所以,別再猶豫,從今天起,加入 Poetry 的行列吧!

參考