模块/包/库
模块、包和库
- 模块: 一堆函数、类、变量的集合
- 包: 一个包可能由多个模块组成
- 库: 一个库可能由多个包和模块组成
模块
以.py
为后缀的文件, 称之为模块.
例子
假设现在有一个名为demo.py的文件:
直接使用import
语句就能导入, 导入之后, 可以使用模块名.变量名
的方式访问这个变量:
注意
在导入模块之后, 模块之内所有未包裹在函数或者类里面的代码都会被执行. 如果你希望在导入包之后不执行顶层代码, 可以使用__name__
参数. 这是一个特殊的内置变量, 一个文件被直接运行的时候, 其内部的__name__
会被解释器设为__main__
; 一个文件被作为模块导入的时候, __name__
的值被设置为该模块的名字.
例子
假设现在有一个名为demo.py的文件:
运行demo.py:
在另一个文件run.py导入这个demo.py模块:
运行run.py:
Tip
可以使用python
命令的-m
选项用于直接运行模块, 该选项后接模块名. 当你使用这个选项之后, 解释器将制定的模块作为脚本执行, 而不仅仅是导入它. 这意味着模块中的所有代码都会被执行, 包括顶层代码, 即被if __name__ == "__main__"
保护的代码块.
Tip
当模块被导入之后, 会在当前目录下产生一个叫做__pycache__
的缓存文件夹. 这里面的文件是模块被导入之后解释器根据模块代码编译生成的字节码. 这样如果以后再次运行的话. 如果调用的模块未发生改变, 那就直接跳过编译这一步, 直接去__pycache__
文件夹里去运行相关的*.pyc
文件, 大大缩短了项目运行前的准备时间.
作用域
在一个模块中, 我们可能定义很多的函数和变量, 有的函数和变量我们希望给别人使用, 有的函数和变量我们希望仅仅在模块内部使用, 这可以通过_
前缀实现.
例子
注意
这种函数是"不应该"被直接引用, 而不是"不能"被直接引用, 这是一种约定俗称的方法, 告诉开发者这个函数不能引用. 在实例变量/函数的访问限制也提到过这个概念.
包
常规包
在Python3.3之前, 一个包想要被导入使用, 包内必须要有__init__.py
文件, 这个是Python识别一个文件夹是否为一个包的重要标志.
例子
目录结构:
现在, 把demo
下的__init__.py
删除, 执行语句:
命名空间包
在Python3.3之后, 即使一个文件夹中没有定义__init__.py
, 也可以被作为命名空间包的形式导入.
库
库是一定功能代码的集合, 通常认为他是一个完整的项目打包.
导入
搜索路径
当我们导入包或者模块的时候, Python解释器会在这两个地方寻找包或者模块:
sys.path
- 运行文件所在的目录
Tip
可以通过sys
模块查看sys.path
.
import
import
只能用于导入包或者模块, 不能导入模块内部的变量/函数/类. 使用内部变量/函数/类的时候要加包或者模块的前缀.
import [module]
import [module] as [alias]
import [package].[module]
import [package].[module] as [alias]
import [package]
: 详见导入包-
import [package].[subpackage]
: 详见导入包
例子
目录结构:
demo.py
文件:
run.py
文件:
执行run.py
:
from ... import ...
from ... import ...
可以用于导入模块, 以及模块中的变量/函数/类, 但是不能用于导入包. 如果导入的是模块, 使用内部变量/函数/类的时候要加上前缀.
from [package] import [module]
from [module] import [var, function, class]
from [package].[module] import [var, function, class]
from [package].[module] import [var, function, class], [var, function, class]
from [package].[module] import *
from [package].[subpackage] import [module]
from [package] import *
from [package] import [var, function, class]
例子
目录结构:
demo.py
文件:
run.py
文件:
运行run.py
文件:
绝对导入和相对导入
绝对导入指的是从根目录开始导入模块. 相对导入指的是从当前文件所在的目录开始导入模块.
相对导入的写法为:
from . import [module]
from .[package] import [module]
from .. import [module]
from ..[package] import [module]
from . import [package]
from . import [package].[module]
例子
目录结构:
c.py
文件内容:
a.py
文件内容:
上述运行a.py
之后会报错, 因为a.py
导入c.py
之后, 再要导入d.py
, 由于a.py
和d.py
在不同的目录下, 所以c.py
导入d.py
的时候会报错. 上述的写法在Python2里面没问题, 但是在Python3里面会报错. 因为这种写法在Python2里面是相对导入, 在Python3里面是绝对导入.
__package__
属性
__package__
属性用于标识模块所属的包, 它在一个模块的值是这样确定的
- 当这个模块是被作为包的一部分导入的时候, 这个模块内的
__package__
是包的名称 - 当这个模块是没有被作为包的一部分导入的时候, 这个模块内的
__package__
是空字符串 - 当这个模块是被直接执行的时候, 这个模块内的
__package__
是None
例子
目录结构:
test.py
文件:
module.py
文件:
执行:
目录结构:
test.py
文件:
module.py
文件:
执行:
__package__
属性和相对导入
当遇到相对导入的时候, 当前模块会将自己的__package__
做为基础, 在这个之上对路径做拼接或者删除, 从而找到对应的模块.
例子
目录结构:
.
├── main
│ ├── __init__.py
│ ├── module.py
│ └── test
│ ├── __init__.py
│ └── module1.py
└── out.py
module.py
文件:
module1.py
文件:
out.py
文件:
执行:
解释: module.py
文件被作为main
包的一部分导入, 所以module.py
模块内的__package__
是main
. 里面的相对导入在这个基础上做拼接: main/test
, 最终找到了module1.py
.
目录结构:
module.py
文件:
module1.py
文件:
执行:
$ python module.py
Traceback (most recent call last):
File "/home/wenzexu/test/main/module.py", line 1, in <module>
from .test import module1
ImportError: attempted relative import with no known parent package
出错的原因是: module.py
由于是直接执行的, 所以其__package__
为None
, 所以解释器无法在None
上做拼接, 所以无法找到对应模块.
__init__.py
文件
__init__.py
文件是一个特殊的文件, 主要用于标识某个目录是一个Python包, 它的主要作用不仅仅只是标识包, 还有很多功能, 下面会一一说明.
__init__.py
是一个模块
特别注意
- 包其实就是模块
- 导入包, 就是导入它的
__init__.py
模块. - 第一次导入包的时候, 其
__init__.py
中的所有代码都会被执行. import
语句或者from ... import ...
中出现的包的__init__.py
模块在第一次导入的时候都会被执行- 所有被导入的模块都会被放在
sys.modules
中, 重复导入这些模块不会被执行, 包括__init__.py
, 因为缓存机制
注意
包中的__init__.py
本身就是一个模块, 在直接导入包的时候, 如import [package]
的时候, 这个__init__.py
的模块会被默认导入, 我们导入之后可以查看sys.modules
, 发现其实__init__.py
这个就是一个被导入的模块.
初始化包
当包第一次被导入的时候, 相当于导入的是__init__.py
模块, __init__.py
文件中的代码会被立即执行, 可以在此文件中初始化包, 设置一些包级别的变量或者执行包级别的初始化操作.
例子
目录结构:
.
└── main
├── __init__.py
├── test1
│ ├── __init__.py
│ └── module1.py
└── test2
├── __init__.py
└── module2.py
main/__init__.py
文件:
在main
的上级文件夹执行:
Tip
第一次导入后, 导入的__init__.py
模块会被放在sys.modules
中, 随后如果再导入, __init__.py
文件将不会再执行.
递归包结构
在包含子包的复杂包结构中, 每个子包目录中也需要包含一个__init__.py
文件.
例子
目录结构:
.
└── main
├── __init__.py
├── test1
│ ├── __init__.py
│ └── module1.py
└── test2
├── __init__.py
└── module2.py
main/__init__.py
文件:
main/test1/__init__.py
文件:
在main
的上级文件夹执行:
控制包的导入行为
通过在__init__.py
中定义__all__
变量, 可以控制from [package] import *
语句的导入行为.
例子
目录结构:
.
└── main
├── __init__.py
├── test1
│ ├── __init__.py
│ └── module1.py
└── test2
├── __init__.py
└── module2.py
main/__init__.py
文件:
main/test1/__init__.py
文件:
main/test1/module1.py
文件:
main/test2/__init__.py
文件:
main/test2/module2.py
文件:
在main
的上级文件夹执行:
解释:
- 第一次从
main
包执行导入from main import *
main
包的__init__.py
模块自动执行__all__
定义为test1
包- 第一次从
test1
包执行导入import test1
test1
包的__init__.py
模块自动执行
目录结构:
.
└── main
├── __init__.py
├── test1
│ ├── __init__.py
│ └── module1.py
└── test2
├── __init__.py
└── module2.py
main/__init__.py
文件:
main/test1/__init__.py
文件:
main/test1/module1.py
文件:
main/test2/__init__.py
文件:
main/test2/module2.py
文件:
在main
的上级文件夹执行:
>>> from main import *
parent package was called
module1 was called
test1 was called
>>> import main
>>>
解释:
- 第一次从
main
包执行导入from main import *
main
包的__init__.py
模块自动执行__all__
定义为test1
包- 第一次从
test1
包执行导入import test1
test1
包的__init__.py
模块自动执行- 执行
test1
包的__init__.py
时发现要导入module1
模块, 执行module1
模块
__main__.py
文件
__main__.py
文件的作用是作为一个包的入口点, 使得包可以像脚本一样直接运行. 当使用python -m [package]
时, [package]
内的__main__.py
模块会自动执行.
执行包
当我们使用python -m [包]
运行包的时候, 会先执行包内的__init__.py
然后执行__main__.py
.
例子
目录结构:
__init__.py
文件:
import sys
print('__init__')
print('__init__.__name__', __name__)
print('__init__.__package__', __package__)
print('sys.path', sys.path)
def hello():
print("Hello from pkg/__init__.py")
__main__.py
文件:
import sys
print('__main__')
print('__main__.__name__', __name__)
print('__main__.__package__', __package__)
print('sys.path', sys.path)
import pkg
pkg.hello()
在pkg
文件夹外执行:
$ python -m pkg
__init__
__init__.__name__ pkg
__init__.__package__ pkg
sys.path ['/Users/wenzexu/test', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '/Users/wenzexu/test/.venv/lib/python3.12/site-packages']
__main__
__main__.__name__ __main__
__main__.__package__ pkg
sys.path ['/Users/wenzexu/test', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '/Users/wenzexu/test/.venv/lib/python3.12/site-packages']
Hello from pkg/__init__.py
疑问
__main__.py
应该是直接被运行的, 所以__name__
是__main__
. 通常情况下, 脚本直接执行会导致其__package__
为None
, 详情见这里. 但是这里与直接执行脚本时稍有不同, 这里Python解释器已经知道__main__.py
是包的一部分, 并不是一个孤立的脚本, 所以这里的__package__
属性会设置为pkg
.
执行文件夹
当我们使用python [文件夹]
执行文件夹的时候, 只会执行文件夹内的__main__.py
文件.
例子
目录结构:
__init__.py
文件:
import sys
print('__init__')
print('__init__.__name__', __name__)
print('__init__.__package__', __package__)
print('sys.path', sys.path)
def hello():
print("Hello from pkg/__init__.py")
__main__.py
文件:
import sys
print('__main__')
print('__main__.__name__', __name__)
print('__main__.__package__', __package__)
print('sys.path', sys.path)
import pkg
pkg.hello()
在pkg
文件夹外执行:
$ python pkg
__main__
__main__.__name__ __main__
__main__.__package__
sys.path ['/Users/wenzexu/test/pkg', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '/Users/wenzexu/test/.venv/lib/python3.12/site-packages']
Traceback (most recent call last):
File "<frozen runpy>", line 198, in _run_module_as_main
File "<frozen runpy>", line 88, in _run_code
File "/Users/wenzexu/test/pkg/__main__.py", line 6, in <module>
import pkg
ModuleNotFoundError: No module named 'pkg'
由于没有加载pkg
包, 所以sys.path
中没有这个包的路径, 所以import pkg
导入失败, 所以, 只要在__main__.py
文件中手动将这个包的路径加入到sys.path
中就好了.
修改后的__main__.py
:
import os, sys
print('__main__')
print('__main__.__name__', __name__)
print('__main__.__package__', __package__)
if not __package__:
path = os.path.join(os.path.dirname(__file__), os.pardir)
sys.path.insert(0, path)
print('sys.path', sys.path)
import pkg
pkg.hello()
在pkg
文件夹外执行:
$ python pkg
__main__
__main__.__name__ __main__
__main__.__package__
sys.path ['/Users/wenzexu/test/pkg/..', '/Users/wenzexu/test/pkg', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '/Users/wenzexu/test/.venv/lib/python3.12/site-packages']
__init__
__init__.__name__ pkg
__init__.__package__ pkg
sys.path ['/Users/wenzexu/test/pkg/..', '/Users/wenzexu/test/pkg', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python312.zip', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12', '/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/lib-dynload', '/Users/wenzexu/test/.venv/lib/python3.12/site-packages']
Hello from pkg/__init__.py
现在就正常了.
打包
打包指的是将一个项目打包成可分发的格式, 以便其他用户或者开发者能够轻松安装和使用. 打包主要可以分为以下几类:
- 原分发包: sdist, 包含了项目的源代码, 通常以
.tar.gz
格式发布, 这种包在安装时需要根据源码进行构建和编译(如过有需要编译的部分, 如C扩展; 如果为纯Python代码, 不需要编译), 常用的工具是setuptools - 二进制分发包: bdist, 包含了预编译的二进制文件, 通常以
.whl
格式发布, 这种包在安装需要根据远吗进行构建, 但是不需要编译(已经包含了预编译的文件, 无论是C扩展还是其他二进制依赖), 常用的工具是setuptools - 独立可执行文件: 这种文件将Python代码和解释器以及搜索的依赖打包在一起, 生成一个可以在没有解释器的环境中运行的单独可执行文件, 常用的工具有pyinstaller, cx_Freeze和py2exe
此外, 我们可以通过twine将打包好的包上传到PYPI.
setuptools
打包
注意
需要先安装setuptools
: pip install setuptools
.
例子
项目结构:
.
├── LICENSE
├── MANIFEST.in
├── README.md
├── mypackage
│ ├── __init__.py
│ ├── __version__.py
│ └── core.py
└── setup.py
MANIFEST.in
文件:
__init__.py
文件:
__version__.py
文件:
# 8b d8 Yb dP 88""Yb db dP""b8 88 dP db dP""b8 888888
# 88b d88 YbdP 88__dP dPYb dP `" 88odP dPYb dP `" 88__
# 88YbdP88 8P 88""" dP__Yb Yb 88"Yb dP__Yb Yb "88 88""
# 88 YY 88 dP 88 dP""""Yb YboodP 88 Yb dP""""Yb YboodP 888888
VERSION = (5, 2, 0)
__version__ = '.'.join(map(str, VERSION))
core.py
文件:
setup.py
文件:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Note: To use the 'upload' functionality of this file, you must:
# $ pipenv install twine --dev
import io
import os
import sys
from shutil import rmtree
from setuptools import find_packages, setup
# Package meta-data.
NAME = '[name]'
DESCRIPTION = '[desc]'
URL = 'https://github.com/ricolxwz/[repo]'
EMAIL = 'ricol.xwz@outlook.com'
AUTHOR = 'ricolxwz'
REQUIRES_PYTHON = '>=3.6.0'
VERSION = '0.1.0'
# What packages are required for this module to be executed?
REQUIRED = [
# 'requests', 'maya', 'records',
]
# What packages are optional?
EXTRAS = {
# 'fancy feature': ['django'],
}
# The rest you shouldn't have to touch too much :)
# ------------------------------------------------
# Except, perhaps the License and Trove Classifiers!
# If you do change the License, remember to change the Trove Classifier for that!
here = os.path.abspath(os.path.dirname(__file__))
# Import the README and use it as the long-description.
# Note: this will only work if 'README.md' is present in your MANIFEST.in file!
try:
with io.open(os.path.join(here, 'README.md'), encoding='utf-8') as f:
long_description = '\n' + f.read()
except FileNotFoundError:
long_description = DESCRIPTION
# Load the package's __version__.py module as a dictionary.
about = {}
if not VERSION:
project_slug = NAME.lower().replace("-", "_").replace(" ", "_")
with open(os.path.join(here, project_slug, '__version__.py')) as f:
exec(f.read(), about)
else:
about['__version__'] = VERSION
# Where the magic happens:
setup(
name=NAME,
version=about['__version__'],
description=DESCRIPTION,
long_description=long_description,
long_description_content_type='text/markdown',
author=AUTHOR,
author_email=EMAIL,
python_requires=REQUIRES_PYTHON,
url=URL,
packages=find_packages(exclude=["tests", "*.tests", "*.tests.*", "tests.*"]),
# If your package is a single module, use this instead of 'packages':
# py_modules=['mypackage'],
# entry_points={
# 'console_scripts': ['mycli=mymodule:cli'],
# },
install_requires=REQUIRED,
extras_require=EXTRAS,
include_package_data=True,
license='MIT',
classifiers=[
# Trove classifiers
# Full list: https://pypi.python.org/pypi?%3Aaction=list_classifiers
'License :: OSI Approved :: MIT License',
'Programming Language :: Python',
'Programming Language :: Python :: 3',
'Programming Language :: Python :: 3.6',
'Programming Language :: Python :: Implementation :: CPython',
'Programming Language :: Python :: Implementation :: PyPy'
],
)
包内容
默认情况下, setuptools
在构建包的时候会包含以下内容:
- Python包: 通过
find_packages()
找到的所有包 - 由
package_data
指定的文件 - 由
MANIFEST.in
指定的文件
注意
使用后两种方法必须要设置include_package_data = True
例子
注意
由package_data
参数指定的文件必须包含在包目录内, 不能指定包含包外面的文件, 如果文件位于包外, 则需要先将其移动到包外面, 然后使用MAINIFEST.in
指定.
项目结构:
myproject/
├── mypackage/
│ ├── __init__.py
│ ├── module.py
│ └── data/
│ ├── config.json
│ └── sample_data.csv
├── README.md
└── setup.py
setup.py
文件:
from setuptools import setup, find_packages
setup(
name='mypackage',
version='0.1.0',
description='A simple example package',
long_description=open('README.md').read(),
long_description_content_type='text/markdown',
author='Your Name',
author_email='your.email@example.com',
url='https://github.com/yourname/mypackage',
packages=find_packages(),
include_package_data=True, # 必须启用这个选项
package_data={
# 包含在 mypackage 中的所有文件
'mypackage': ['data/*.json', 'data/*.csv'],
},
python_requires='>=3.6',
)
这种情况下, 如果你运行python setup.py sdist
, 默认情况下, 源分发包只会包含mypackage
目录以及其中的模块以及包外的README.md
和LICENSE
等必要文件, 其他的文件, 如data/config.json
和data/sample_data.csv
不会包含在源分发包中. 为了包含着这两个文件, 使用了package_data
指定这些文件需要包含到打包好的包里面.
笔记
由MANIFEST.in
指定的文件可以在包内也可以在包外.
项目结构:
myproject/
├── mypackage/
│ ├── __init__.py
│ └── module.py
├── README.md
├── setup.py
└── data/
└── dataset.csv
setup.py
文件:
from setuptools import setup, find_packages
setup(
name='mypackage',
version='0.1.0',
description='A simple example package',
long_description=open('README.md').read(),
long_description_content_type='text/markdown',
author='Your Name',
author_email='your.email@example.com',
url='https://github.com/yourname/mypackage',
packages=find_packages(),
include_package_data=True,
python_requires='>=3.6',
)
这种情况下, 如果你运行python setup.py sdist
, 默认情况下, 源分发包只会包含mypackage
目录以及其中的模块以及包外的README.md
和LICENSE
等必要文件, 其他的文件, 如data/dataset.csv
不会包含在源分发包中.
为了包含着两个文件, 可以创建一个MANIFEST.in
, 并指定这些文件:
再次运行时, 源分发包将包含:
mypackage/
目录以及其中的所有模块以及包外的README.md
和LICENSE
等必要文件data/
目录以及其中所有的.csv
文件
打包
可以通过python setup.py sdist
生成原分法包, 或者使用python setup.py bdist_wheel
生成二进制分发包, 打包后的文件放在dist文件夹中, 扩展名分别为.tar.gz
和.whl
.
注意
在打包之前, 需要清理掉之前所有打包产生的文件: rm -rf build dist *.egg-info
参数
描述
我们可以在setup.py
中将long_description
设置为项目下的README.md
文件:
例子
here = os.path.abspath(os.path.dirname(__file__))
# Import the README and use it as the long-description.
# Note: this will only work if 'README.md' is present in your MANIFEST.in file!
try:
with io.open(os.path.join(here, 'README.md'), encoding='utf-8') as f:
long_description = '\n' + f.read()
except FileNotFoundError:
long_description = DESCRIPTION
__file__
在这里时setup.py
的文件名, here
保存的是setup.py
的绝对路径. 我们将README.md
文件读出, 然后赋值给long_description
. 最后在setup()
函数中设置.
版本
我们可以将版本设置为包目录下__version__.py
文件中设置的版本:
例子
setup.py
文件(部分):
# Load the package's __version__.py module as a dictionary.
about = {}
if not VERSION:
project_slug = NAME.lower().replace("-", "_").replace(" ", "_")
with open(os.path.join(here, project_slug, '__version__.py')) as f:
exec(f.read(), about)
else:
about['__version__'] = VERSION
__version__.py
文件:
`__version__.py`文件:
```py
# 8b d8 Yb dP 88""Yb db dP""b8 88 dP db dP""b8 888888
# 88b d88 YbdP 88__dP dPYb dP `" 88odP dPYb dP `" 88__
# 88YbdP88 8P 88""" dP__Yb Yb 88"Yb dP__Yb Yb "88 88""
# 88 YY 88 dP 88 dP""""Yb YboodP 88 Yb dP""""Yb YboodP 888888
VERSION = (5, 2, 0)
__version__ = '.'.join(map(str, VERSION))
找到__version__.py
文件之后, 使用exec()
执行里面的代码, 第二个参数指定了一个命名空间.
例子
将其版本保存到about
这个字典中, 在setup()
函数中使用. 如果没找到这个文件的话, 使用的是setup.py
中定义的VERSION
变量的值.
依赖
setup()
函数中的install_requires
用于指定核心依赖, extras_require
用于指定可选依赖.
-
install_requires
指定的依赖无论用户以何种方式安装你的包, 这些都会被安装. -
extras_require
指定的是可选依赖, 可以为你的包指定一些额外的依赖, 但不是必需品, 用户可以选择是否安装这些依赖.
其他参数
简短解释一下setup()
函数中的其他参数以及复习一下已经讲过的参数:
-
name
: 包的名称Tip
包的名称中的连字符用
-
, 而实际包的名字中的连字符用_
, 因为导入包的时候带有-
的包需要用到importlib
, 比较麻烦. -
verision
: 包的版本号 description
: 包的简短描述long_description
: 包的详细描述long_description_content_type
: 包的详细描述的文件类型, 一般是text/markdown
author
: 包的作者author_email
: 包的作者的邮箱python_requires
: 指定Python的版本范围url
: 包的主页地址packages
: 指定要打的包, 可以使用find_packages()
函数自动寻找要打的包py_modules
: 如果是单个模块, 使用的不是package
而是py_modules
entry_point
: 定义包的命令行脚本入口点install_requires
: 指定核心依赖extras_require
: 指定可选依赖include_package_data
: 设置是否可以包含其他文件license
: 包的许可证classifiers
: 分类标签, 帮助用户找到你的包cmdclass
: 支持在命令行运行自定义命令
上传
twine
上传
注意
需要先安装twine
: pip install twine
.
可以通过twine upload dist/*
命令将dist
文件夹下的所有包都上传到PYPI.
Tip
-
可以先上传到TestPYPI检测一下自己的包是否正常, 是否可以通过
pip
下载安装. -
可以在用户目录
~
下创建一个文件.pypirc
保存自己的Token:
工具
poetry
poetry是一个Python的依赖, 环境管理和打包工具.
安装依赖11
可以通过poetry install
安装所有的依赖, 执行该命令后, 会有两种情况:
-
当前目录下没有
poetry.lock
文件, 有pyproject.toml
文件poetry会解析
pyproject.toml
文件中的依赖并下载条件范围内最新的依赖. 完成安装后, 将所有依赖的版本记录在poetry.lock
文件中. -
当前目录下有
poetry.lock
文件, 有pyproject.toml
文件poetry会解析
pyproject.toml
文件中的依赖, 并查看poetry.lock
文件- 若
poetry.lock
中的相应依赖的版本号在pyproject.toml
声明的范围内, 下载poetry.lock
的版本 - 若
poetry.lock
中的相应依赖的版本号不在pyproject.toml
声明的范围内, 报错
- 若
2a见下方例子1, 2, 3; 2b见下方例子4.
注意
在2a.情况下, 每次执行poetry install
之前会检查pyproject.toml
文件有无变化, 具体的原理是对去掉空格后的pyproject.toml
文件求哈希值, 并记录在poetry.lock
文件的content-hash
字段中, 若修改pyproject.toml
文件后没有更新content-hash
, 那么执行poetry install
会报错.
解决方法: 修改pyproject.toml
文件后, 使用poetry lock --no-update
更新这个哈希值, 需要注意的是这个命令和poetry lock
的区别:
poetry lock
: 解析pyproject.toml
文件中的依赖, 将条件范围内最新的依赖版本号更新到poetry.lock
文件中poetry lock --no-update
: 解析pyproject.toml
文件中的依赖- 若
poetry.lock
中的相应依赖的版本号在pyproject.toml
声明的范围内, 保持poetry.lock
的该版本号不变, 见下方例子1 - 若
poetry.lock
中的相应依赖的版本号不在pyproject.toml
声明的范围内, 更新poetry.lock
中的相应依赖的版本号为pyproject.toml
条件范围内最新的依赖版本号, 见下方例子3
- 若
使用poetry lock --no-update
更新这个哈希值的原因是因为我们不希望poetry.lock
中在pyproject.toml
条件范围内的版本号发生变化, 只希望更新content-hash
字段的值(注意两个命令都会更新content-hash
).
Tip
- 若项目无需打包, 可以在
pyproject.toml
文件在[tool.poetry]
中设置package-mode = false
-
若需要在本地生成虚拟环境, 可以在
poetry.toml
文件中设置:
例子
结构:
pyproject.toml
文件:
[tool.poetry]
name = "test"
version = "0.1.0"
description = ""
authors = ["wenzexu <ricol.xwz@outlook.com>"]
package-mode = false
[tool.poetry.dependencies]
python = "^3.12"
requests = "2.10.0"
[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
poetry.lock
文件:
# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.
[[package]]
name = "requests"
version = "2.10.0"
description = "Python HTTP for Humans."
optional = false
python-versions = "*"
files = [
{file = "requests-2.10.0-py2.py3-none-any.whl", hash = "sha256:09bc1b5f3a56cd8c48d433213a8cba51a67d12936568f73b5f1793fcb0c0979e"},
{file = "requests-2.10.0.tar.gz", hash = "sha256:63f1815788157130cee16a933b2ee184038e975f0017306d723ac326b5525b54"},
]
[package.extras]
security = ["ndg-httpsclient", "pyOpenSSL (>=0.13)", "pyasn1"]
socks = ["PySocks (>=1.5.6)"]
[metadata]
lock-version = "2.0"
python-versions = "^3.12"
content-hash = "25c064eaf29678762031b94d64762b5e9c717f8c86cb22a24b35a9e469c992a8"
现在, 手动修改pyproject.toml
文件:
[tool.poetry]
name = "test"
version = "0.1.0"
description = ""
authors = ["wenzexu <ricol.xwz@outlook.com>"]
package-mode = false
[tool.poetry.dependencies]
python = "^3.12"
requests = ">=2.10.0"
[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
执行poetry install
:
$ poetry install
Installing dependencies from lock file
pyproject.toml changed significantly since poetry.lock was last generated. Run `poetry lock [--no-update]` to fix the lock file.
这就是上面注意中提到的由于content-hash
发生改变导致安装失败. 通过poetry lock --no-update
更新哈希值:
我们来看一下新的content-hash
:
# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.
[[package]]
name = "requests"
version = "2.10.0"
description = "Python HTTP for Humans."
optional = false
python-versions = "*"
files = [
{file = "requests-2.10.0-py2.py3-none-any.whl", hash = "sha256:09bc1b5f3a56cd8c48d433213a8cba51a67d12936568f73b5f1793fcb0c0979e"},
{file = "requests-2.10.0.tar.gz", hash = "sha256:63f1815788157130cee16a933b2ee184038e975f0017306d723ac326b5525b54"},
]
[package.extras]
security = ["ndg-httpsclient", "pyOpenSSL (>=0.13)", "pyasn1"]
socks = ["PySocks (>=1.5.6)"]
[metadata]
lock-version = "2.0"
python-versions = "^3.12"
content-hash = "6363722bb38e3bb0c73ccbb1763cce8684871565683659092475ba2763c452a3"
可以看到哈希值改变了, 但是版本号没变. 再次执行poetry install
, 下载poetry.lock
对应的版本, 即2.10.0
:
$ poetry install
Installing dependencies from lock file
Package operations: 1 install, 0 updates, 0 removals
- Installing requests (2.10.0)
可以看到成功安装.
在实际开发过程中, 若某模块推出新的版本的时候, 如requests
模块我们在pyproject.toml
中定义的条件范围是>=2.32.2
, 若现在出现了一个新的版本2.32.4
, 而poetry.lock
中的版本是2.32.3
, 这个时候我们不需要去执行poetry lock --no-update
, 因为pyproject.toml
文件没有发生改变, 当我们执行poetry install
之后, 安装的还是2.32.3
这个版本, 也就是情况2a
结构:
pyproject.toml
文件:
[tool.poetry]
name = "test"
version = "0.1.0"
description = ""
authors = ["wenzexu <ricol.xwz@outlook.com>"]
package-mode = false
[tool.poetry.dependencies]
python = "^3.12"
requests = "2.10.0"
[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
poetry.lock
文件:
# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.
[[package]]
name = "requests"
version = "2.10.0"
description = "Python HTTP for Humans."
optional = false
python-versions = "*"
files = [
{file = "requests-2.10.0-py2.py3-none-any.whl", hash = "sha256:09bc1b5f3a56cd8c48d433213a8cba51a67d12936568f73b5f1793fcb0c0979e"},
{file = "requests-2.10.0.tar.gz", hash = "sha256:63f1815788157130cee16a933b2ee184038e975f0017306d723ac326b5525b54"},
]
[package.extras]
security = ["ndg-httpsclient", "pyOpenSSL (>=0.13)", "pyasn1"]
socks = ["PySocks (>=1.5.6)"]
[metadata]
lock-version = "2.0"
python-versions = "^3.12"
content-hash = "25c064eaf29678762031b94d64762b5e9c717f8c86cb22a24b35a9e469c992a8"
现在, 手动修改pyproject.toml
文件:
[tool.poetry]
name = "test"
version = "0.1.0"
description = ""
authors = ["wenzexu <ricol.xwz@outlook.com>"]
package-mode = false
[tool.poetry.dependencies]
python = "^3.12"
requests = "<2.9.0"
[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
执行poetry install
:
$ poetry install
Installing dependencies from lock file
pyproject.toml changed significantly since poetry.lock was last generated. Run `poetry lock [--no-update]` to fix the lock file.
这就是上面注意中提到的由于content-hash
发生改变导致安装失败. 通过poetry lock --no-update
更新哈希值:
我们来看一下新的content-hash
:
# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.
[[package]]
name = "requests"
version = "2.8.1"
description = "Python HTTP for Humans."
optional = false
python-versions = "*"
files = [
{file = "requests-2.8.1-py2.py3-none-any.whl", hash = "sha256:89f1b1f25dcd7b68f514e8d341a5b2eb466f960ae756822eaab480a3c1a81c28"},
{file = "requests-2.8.1.tar.gz", hash = "sha256:84fe8d5bf4dcdcc49002446c47a146d17ac10facf00d9086659064ac43b6c25b"},
]
[package.extras]
security = ["ndg-httpsclient", "pyOpenSSL", "pyasn1"]
[metadata]
lock-version = "2.0"
python-versions = "^3.12"
content-hash = "863f6f137ec905c3cca085aef062a74a42f9b9186d74d8ca18a26d70ba58e86a"
可以看到哈希值改变了, 版本号也改变了, 变成了pyproject.toml
中条件范围内的最新版本, 即2.8.1
版本, 再次执行poetry.install
, 对应情况2a, 这个时候的poetry.lock
中相应依赖的版本号在pyproject.toml
声明的范围内, 所以下载的是2.8.1
版本的依赖.
结构:
pyproject.toml
文件:
[tool.poetry]
name = "test"
version = "0.1.0"
description = ""
authors = ["wenzexu <ricol.xwz@outlook.com>"]
package-mode = false
[tool.poetry.dependencies]
python = "^3.12"
requests = "2.10.0"
[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
poetry.lock
文件:
# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.
[[package]]
name = "requests"
version = "2.10.0"
description = "Python HTTP for Humans."
optional = false
python-versions = "*"
files = [
{file = "requests-2.10.0-py2.py3-none-any.whl", hash = "sha256:09bc1b5f3a56cd8c48d433213a8cba51a67d12936568f73b5f1793fcb0c0979e"},
{file = "requests-2.10.0.tar.gz", hash = "sha256:63f1815788157130cee16a933b2ee184038e975f0017306d723ac326b5525b54"},
]
[package.extras]
security = ["ndg-httpsclient", "pyOpenSSL (>=0.13)", "pyasn1"]
socks = ["PySocks (>=1.5.6)"]
[metadata]
lock-version = "2.0"
python-versions = "^3.12"
content-hash = "25c064eaf29678762031b94d64762b5e9c717f8c86cb22a24b35a9e469c992a8"
现在, 手动修改pyproject.toml
文件:
[tool.poetry]
name = "test"
version = "0.1.0"
description = ""
authors = ["wenzexu <ricol.xwz@outlook.com>"]
package-mode = false
[tool.poetry.dependencies]
python = "^3.12"
requests = "<2.9.0"
[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
这里, 不能使用poetry lock --no-update
, 若执行, 会导致版本号变为2.8.1
, 正常安装; 而我们模拟的是没有执行poetry lock --no-update
的情况, 所以应该把修改后的pyproject.toml
的哈希值粘贴到poetry.lock
文件中(这个哈希值可以参考例子3):
# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.
[[package]]
name = "requests"
version = "2.10.0"
description = "Python HTTP for Humans."
optional = false
python-versions = "*"
files = [
{file = "requests-2.10.0-py2.py3-none-any.whl", hash = "sha256:09bc1b5f3a56cd8c48d433213a8cba51a67d12936568f73b5f1793fcb0c0979e"},
{file = "requests-2.10.0.tar.gz", hash = "sha256:63f1815788157130cee16a933b2ee184038e975f0017306d723ac326b5525b54"},
]
[package.extras]
security = ["ndg-httpsclient", "pyOpenSSL (>=0.13)", "pyasn1"]
socks = ["PySocks (>=1.5.6)"]
[metadata]
lock-version = "2.0"
python-versions = "^3.12"
content-hash = "863f6f137ec905c3cca085aef062a74a42f9b9186d74d8ca18a26d70ba58e86a"
执行poetry install
:
$ poetry install
Installing dependencies from lock file
Because test depends on requests (<2.9.0) which doesn't match any versions, version solving failed.
可以看到, 报错了.
-
【基础】什么是包、模块和库?—Python&图像处理教程 文档. (n.d.). From http://await.fun/PythonTutorial/p06/1.html ↩
-
python中import的用法—PythonJoy. (n.d.). From https://joy9191.github.io/16196181446571.html ↩
-
以python -m site命令为例解释-m选项-CSDN博客. (n.d.). From https://blog.csdn.net/jiaxin576/article/details/138574683 ↩
-
使用模块. (n.d.). From https://www.liaoxuefeng.com/wiki/1016959663602400/1017455068170048 ↩
-
ennethreitz/setup.py: 📦 A Human’s Ultimate Guide to setup.py. (n.d.). From https://github.com/kennethreitz/setup.py ↩
-
Python中__init__.py文件的作用—小蓝博客. (n.d.). From https://www.8kiz.cn/archives/20137.html ↩
-
Python入门之——Package内的__main__.py和__init__.py_51CTO博客___main__.py文件. (n.d.). From https://blog.51cto.com/feishujun/5513660 ↩
-
Henry. (2021, May 23). 一文理解Python导入机制. Henry’s Blog. https://hzhu212.github.io/posts/b9859a94/index.html ↩
-
The import system. (n.d.). Python Documentation. From https://docs.python.org/3/reference/import.html ↩
-
Command line and environment. (n.d.). Python Documentation. From https://docs.python.org/3/using/cmdline.html ↩
-
Basic usage | Documentation | Poetry—Python dependency management and packaging made easy. (n.d.). From https://python-poetry.org/docs/basic-usage/#installing-without-poetrylock ↩