Working with Python subprocess
执行程序时发生了什么
当你双击桌面上的终端程序图标时,就会打开一个载入shell的程序。 你键入的命令不会直接在内核执行,而是先和 shell 进行交互。
Command (eg. `ls -l')
↓
Terminal Program (eg. `gnome-terminal')
↓
Shell (eg Bash)
↓
Kernel (eg. Linux 2.6.24)
更多关于进程如何运行的信息:
当你通过 Python 执行程序时候,你可以选择直接从内核执行或者通过 shell。 如果你选择直接执行,你就没办法和 bash 同样方式执行命令。 www.zzzyk.com
我们先看看怎么使用 shell 和那些好玩的特性功能, 然后再通过subprocess来实现同样的功能,
数据流
在 UNIX 和 Linux 下,有三个被称作流的 I/O 通道,它们通过文本终端 (比如用 gnome-terminal 运行 Bash)和其他应用程序(比如通过 Python 的subprocess)这类环境来连接程序。 这几个 I/O 通道分别称为标准输入,标准输出,和标准错误输出, 它们的文件描述符分别为 0,1,2。
句柄 名称 描述
0 stdin 标准输入
1 stdout 标准输出
2 stderr 标准错误输出
这里你能看到标准输入叫做stdin,标准输出称作stdout,标准错误输出叫做stderr。
流是这样工作的:从终端输出获取输入并通过标准输入发送到程序, 程序返回的正常输出从标准输出输出,错误则返回到环境上下文的标准错误输出。 易做图有幅图将描述这个过程:
如果你想将流从一个程序重定向到另一个地方,请看下文分解。
使用 Shell
重定向标准输入和输出到文件
你可以在 Bash 中使用>操作符将一个程序的标准输出重定向到一个文件 (在其他 Shell 也许略有语法差异)。这里有个范例:
program1 > file1
program1执行后的输出结果从标准输出流写入file1,并将file1其中现有的内容所替换。如果你只是想追加内容,你可以使用>>操作符:
program1 >> file1
<操作符可以被用来从文件中读取数据并传输到程序的标准输入流:
program1 < file1
同样的,program1会被执行,但是此时file1取代了键盘, 成为了标准输入的数据源。
你可以组合 shell 操作符以完成更复杂的操作。 下面这个范例中,program1从file1获取数据并发送到标准输入。标准输出则从program1输出到file2。
program1 < file1 > file2
也许有时候你需要从一个程序获取输出并将其作为另一个程序的输入。 你可以通过一个临时文件来实现这个操作:
program1 > tempfile1
program2 < tempfile1
rm tempfile1
这种方法有点累赘,因此 shell 提供了方便的机制,称为管道
管道
管道允许一个程序的标准输出直接输入到另一个程序的标准输入流中, 而无须创建临时文件:
program1 | program2
操作符|被称作管道符号,因此这种操作就被称为管道。
这里有一幅来自易做图的图片来描述管道:
这里有个使用find .(遍历当前目录下的文件和目录)的例子,将输出定向到grep程序来查找特定文件:
find . | grep "The file I'm after.txt"
第一个程序产生的数据是一行一行地导向第二个程序的,所以在第一个程序运行结束之前, 第二个程序就可以开始使用它们。
从文件重定向标准输入和输出
在重定向标准输出的同时,你也可以重定向其他流, 比如重定向标准错误输出到标准输出。我们已经讨论过在 Bash 中, 可以在文件描述符之前使用>,<和>>操作符来重定向数据流 (还记得之前讨论的数字 0,1,2 么)。如果把标准输出代表的数字 1 省略掉看, 会发现我们一直在使用标准输出。
下面这条命令执行program1并将所有标准错误数据输出到file1。
program1 2> file1
执行program1,错误信息就被重定向到file了。
这里有个范例程序让你来测试,将它保存成redirect1.py:
import sys
while 1:
try:
input = sys.stdin.readline()
if input:
sys.stdout.write('Echo to stdout: %s'%input)
sys.stderr.write('Echo to stderr: %s'%input)
except KeyboardError:
sys.exit()
这个程序始终将接受到的输入数据并同时输出到 stdout 和 stderr 。
在 csh 衍生出来的 shell 中,语法则是在重定向符号之后加上&符号, 可以达到同样的效果。(译者注:即|&)
另一个常用的特性是将一个输出流重定向到定一个。 最常见的用法是将标准错误输出重定向到标准输出, 这样就可以把错误信息和正确信息合并在一起,比如:
find / -name .profile > results 2>&1
命令将会找出所有名叫.profile的文件。 如果没有重定向,它将输出命中信息到 stdout,错误信息到 stderr (比如有些目录无权限访问)。如果标准输出定向到文件,错误信息则会显示在命令行上。 为了在结果文件中可以同时看到命中信息和错误信息,我们需要使用2>&1将标准错误输出(2)输出到标准输出(1)。(这次即使在 Bash 中也需要&符。)
虽然语法上可以将2>&1放到>前面,但这样不能正常工作。 事实上,当解析器读取2>&1时候,它还不知道标准输出将重定向到哪里, 所以标准错误输出就不会被合并。
如果使用管道合并输出流,那么合并符号2>&1需要在管道符号|之前。比如:
find / -name .profile 2>&1 | less
Bash 中的合并输出简写形式是:
command > file 2>&1
为:
command &>file
或者:
command >&file
但是最好别用简写形式,否则你会弄糊涂。我提倡宁愿麻烦但是要清晰。
&>操作符同时重定向标准输出和标准错误输出。 它的作用和在 Bourne Shell 中的command > file 2>&1一样。
管道链
重定向可以和管道连接起来组成复杂的命令,比如:
ls | grep '\.sh' | sort > shlist
列出当前目录下所有文件,然后过滤剩下仅包含 .sh 的内容,根据文字编码排序, 然后将最终结果输出到 shlist。这种类型的命令经常在 shell 脚本和批处理文件中使用。
多重输出重定向
标准命令tee可以重定向一个命令到多个地方。
ls -lrt | tee xyz
这将文件列表同时输出到标准输出和文件xyz中。
Here 文档
大部分 Shell,包括 Bash 都支持Here 文档,它允许你使用<<操作符和一些文本作为分隔符将文本块嵌入到命令之中。
在下面的范例中,文本块被传送给tr命令,同时使用END_TEXT作为 Here 文档分隔符来指明文本的开始和结束。
$ tr a-z A-Z <<END_TEXT
> one two three
> uno dos tres
> END_TEXT
ONE TWO THREE
UNO DOS TRES
经过tr处理后,输出的结果是ONE TWO THREE和UNO DOS TRES。
一种常用用法是用 Here 文档向文件添加文本。 默认情况下,文本中的变量是会被替换成真实值的。
$ cat << EOF
> Working dir $PWD
> EOF
Working dir /home/user
通过在 Here 文档标签引上单引号或者双引号,就可以避免这种转义:
$ cat << "EOF"
> Working dir $PWD
> EOF
Working dir $PWD
介绍subprocess
刚才我们讨论过了一些命令行提供的功能,现在让我们体验一下subprocess模块。 你可以在命令行中运行下面这条简单的命令:
$ echo "Hello world!"
Hello world!
让我们试着在 Python 中运行它。
以前我们需要使用一堆各异的标准库来实现进程管理。 从 Python 2.4 开始,所有功能都被精心地整理到subprocess这个模块, 其中的Popen类可以提供所有我们需要的。
注意
如果你对新的Popen如何替换旧模块,[subprocess-doc][subprocess-documentation] 有一个章节解释过去是如何作用以及当前是如何作用。
Popen可以接受一下参数,详情可以在 [using-the-subprocess-module][http://docs.python.org/library/subprocess.html#using-the-subprocess-module]:
subprocess.Popen(args, bufsize=0, executable=None, stdin=None,
stdout=None, stderr=None, preexec_fn=None, close_fds=False,
shell=False, cwd=None, env=None, universal_newlines=False,
startupinfo=None, creationflags=0
)
补充:Web开发 , Python ,