Android架构纵横谈之二—基于性能的考虑(1)
By LiAnLab.org / 宋宝华
《Android架构纵横谈之一——软件自愈能力》已经谈地告了一个段落。接下来这个系列二我们谈Android性能方面的考虑。Android系 统组件繁杂,盘根错节,若非在性能上进行充分的考虑,恐怕会慢如蜗牛。Android有独具特色的Dalvik虚拟机,启动过程中即加载许多资源以便子进 程进行继承的Zygote,广泛使用共享内存的AudioFlinger、 Su易做图ceFlinger、属易做图,应用程序对图形的direct render,简单高效的新增的IPC 方式binder等。我们大概还是分成多回来谈。
今天我们先谈AndroidJava 世界女娲Zygote 的高妙之处,歌颂其在广阔深蓝到处打渔的壮美举动。广大读者仍然可以透过新浪微博“@宋宝华Barry ”进行交流,写技术博客是个非常痛苦的过程,所以无论是板砖的也好,喝彩的也好,欢迎都上来吆喝几声。我这边特别要声明的是,本系列不着眼于谈细小的知识 点,而更多的是谈设计思想上的考虑。
Java世界的“固有领土”
同志们,进程是一个资源封装的单位,所谓进程,就是讲易做图丝们的房子、车子, task_struct是Linux 内核里用于描述进程的数据结构,进程就是资源,故task_struct就是封装了一个个的资源以及进程的属性(如pid等 ),它的定义如下:
struct task_struct {
易做图丝名: comm
易做图丝id: pid
易做图丝房子:mm_struct
易做图丝车子:fs_struct
易做图丝工资: signal_struct
…
易做图丝状态: 睡、干活、僵尸等
}
所以task_struct天生就是针对当今社会而生的,一个结构体把所有你资产全部囊括。
线程是CPU调度的单元,虽然是一套房子 mm_struct、一部车子fs_struct、一个人工资signal_struct等,如果被2个或者多个易做图丝所共享(这里就是这些结构体指针指向 完全相同,pthread_create透过clone实现了这个功能),那么这几个易做图丝就是同一个进程里面的多个线程了。
Linux中每 个易做图丝都是个task_struct,内核并不区分进程和线程,只是通过一个房子挂到2个task_struct的头上来实现线程的。简单地说,您和您老 婆是2个task_struct,但是有个 房产证mm_struct是同一个。但是作为2个线程,厕所(CPU)这个唯一资源还是要轮着来被调度的。
一 般情况下,Linux的进程通过fork诞生,这个时候,子进程的mm_struct指针并不等于父进程的mm_struct,而是重新分配一个 mm_struct内存并让它等于负进程的mm_struct,所以子进程这个时候也share了父进程的资源。关于这个继承,原因很简单,因为几千年前 咱有几个易做图丝去那边打过鱼,属于咱们固有的资源。这些继承的资源是只读的,如果要写,就会造成一个“写时拷贝”,内核会为写的进程重新申请1个page并 拷贝老的page,在新的page上再进行写。
一般情况下,子进程被fork出来后,会调用exec()对userspace进行替换,典型地Android的init使用了该模型:
exec() 用一个可执行文件替换当前子进程的用户空间。注意在exec()对userspace替换后,除pid等id信息保留外,0、1、2这3个代表标准输入、 输出、错误输出的fd依然保留原来的含义,这使得我们Android的 init进程可以启动init.rc的service的时候,将0、 1、2重定向到/dev/null,看看 Android的init启动service的过程:
static void zap_stdio(void)
{
int fd;
fd = open("/dev/null", O_RDWR);
dup2(fd, 0);
dup2(fd, 1);
dup2(fd, 2);
close(fd);
}
void service_start(struct service *svc, const char *dynamic_args)
{
…
pid = fork();
if (pid == 0) {
…
if (needs_console) {
…
} else {
zap_stdio();
}
…
execve(svc->args[0], (char**) arg_ptrs, (char**) ENV);
}
}
可以看出init创建的service都是被fork+exec整出来的,一般情况下,printf的东西就这样没了,因为在exec()前就被 dup到了/dev/null。
但是 init并非工作在Java的世界,而Java的世界通过Zygote产生。Java程序最终不会如同C/C++ native代码那样可以被编译和连接为一个可执行文件,Java源程序经过编译得到的并非可执行程序而是中间码,由Java虚拟机解释执行,所以没有办 法被exec()。Java的性能下降了,但是,由于没有exec(),却成就了 fork()对资源的继承性,否则,被exec()后,userspace会被整体替换。
Zygote启动的SystemServer 和apk都只是先 fork,而后寻找到相应目标类的main()函数并执行,这个过程没有exec()。既然如此,在Android的Java世界里,必然存在某些资源是 可能被许多进程所共同需要的,这个机会绝对不会被我天朝的渔民放过,肯定要先去打个渔以便小白兔直接宣传其为“固有领土”,这个过程主要是 preloadClasses和preloadResources。
要preload的class存放在 frameworks/base/preloaded-classes文件中,这个文件快2000行了,咱天朝几千年前的易做图丝真牛b啊,到处打渔,黄岩 岛、易做图该去的都去了,还有很多礁什么的,也跑了一遭,直接把天朝打成高富帅了:
android.R$styleable
android.accounts.Account
android.accounts.Account$1
android.accounts.AccountManager
岛太多,下面省略
preloadResources则主要加载framework-res.apk中的资源。这2个preload的过程实在很慢啊,你用bootchart观察Android启动过程,可能发现5000年文明史有一半都被Zygote拿去打渔去了:
有人说,既然preload东东这么慢,严重影响了开机速度,那我们不要preload不就好了吗?
同志们啊,preload的意义就是先hold住打个渔,fork()子进程都发生在此之后,子进程如果用的时候直接就可以用了。如果这个过程不做的话, 那么就需要每个子进程自己用的时候再去load,那该多耗费多少内存以及多慢呢?祖先们去打渔好处是明显的。
最后,我们要说的是没了exec(),Java语言对应的进程就失去了一种能力,举个例子,你如果要透过valgrind检查SystemServer的 native层内存泄露、溢出或者某个 apk的native层内存泄露、溢出 ,你不可能敲个命令行叫:valgrind --tool=memcheck --leak-check=full systemserver吧?
而这样的需求却真实地存在着,于是Jeff Brown jeffbrown@google.com提交了让Android Java程序以exec方式被启动的patch ,这些patch分布于对dalvik_system_Zygote.c、Zygote.java、app_process/app_main.cpp、 RuntimeInit.java,并新增加了一个WrapperInit.java文件,使得我们可以通过exec()的方式启动Java程序,这样我 们在 Java程序启动前插入 wrap(如valgrind)就很easy了,这个过程实际上就是:
public static void execApplication(String invokeWith, String niceName,
FileDescriptor pipeFd, String[] args) {
StringBuilder command = new StringBuilder(invokeWith);
command.append(" /system/bin/app_process /system/bin --application");
if (niceName != null) {
command.append(" '--nice-name=").append(niceName).append("'");
}
command.append(" com.android.internal.os.WrapperInit ");
command.append(pipeFd != null ? IoU
补充:移动开发 , Android ,