进程和线程、协程的区别
2020-06-12| 程成| 289| 0| 计算机知识

现在多进程多线程已经是老生常谈了,协程也在最近几年流行起来。python中有协程库gevent,go里面的goroutine也是一个非常棒的协程库。本文主要介绍进程、线程和协程三者之间的区别。


概念


进程


进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,也是基本的执行单元,是操作系统结构的基础。


每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量,占据独立的内存,所以上下文进程间的切换开销(栈、寄存器、虚拟内存、文件句柄等)比较大,但相对比较稳定安全。


线程


线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。


线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。线程间通信主要通过共享内存,上下文切换很快,资源开销较少,但相比进程不够稳定容易丢失数据。


协程


协程是一种用户态的轻量级线程,协程的调度完全由用户控制。协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。


区别


进程与线程比较


一般来说,进程与线程多被一起作比较


  1. 地址空间:线程是进程内的一个执行单元,进程内至少有一个线程,它们共享进程的地址空间,而进程有自己独立的地址空间

  2. 资源拥有:进程是资源分配和拥有的单位,同一个进程内的线程共享进程的资源

  3. 线程是处理器调度的基本单位,但进程不是

  4. 二者均可并发执行

  5. 每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口,但是线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制


协程与线程比较


  1. 一个线程可以多个协程,即一个内核线程对应多个用户协程(用户进程)。

  2. 进程、线程,都是有内核进行调度,有CPU时间片的概念,进行抢占式调度(有多种调度算法)

  3. 协程的调度与内核无关,完全有程序进行控制。只能进行非抢占式调度。

  4. 线程进程都是同步机制,而协程则是异步。

  5. 协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态


实例


pthread


用户代码通过pthread库创建线程的过程虽然看似是用户在创建“用户级线程”,实际上是pthread_create暗中调用了clone系统调用,由操作系统帮忙创建内核级线程的过程,因而不能称作用户级线程。此时,用户线程和内核线程是一个1:1的模型1。


其他线程库的实现,可以支持M:N或者1:N。即多个用户线程对应一个内核线程。此时的用户线程可以在一定程度上认为是轻量级线程,或者协程。


goroutine


本质上,goroutine 就是协程。 不同的是,Golang 在 runtime、系统调用等多方面对 goroutine 调度进行了封装和处理,当遇到长时间执行或者进行系统调用时,会主动把当前 goroutine 的CPU § 转让出去,让其他 goroutine 能被调度并执行,也就是 Golang 从语言层面支持了协程。




×
作者:程成
QQ:492245711