UNIX环境高级编程中关于原子操作的介绍,其中有一种情形是在文件尾端添加数据。文中说,如果多个进程都需要将数据添加到某一文件,那么为了保证定位和写数据这两步是一个原子操作,需要在打开文件时设置O_APPEND标志,看到这里我们就会想,虽然保证了定位和写数据是一个原子操作,但是是否能够保证多个进程或线程写入的数据不会交错呢,比如A进程调用write(filedes1, "AAA", 3),B进程调用write(filedes2, "BBBB", 4)(其中filedes1和filedes2指向同一个文件),但是最后文件中的数据是否有可能是AABBBAB,如果这个文件是一个管道或socket呢。linux man手册页中关于write调用的说明很不详细,并未说明写操作是否是原子的,所以我们有必要查找Single UNIX Specification(SUS)对write调用的说明,在SUS中对此调用的说明还是比较详细的。在继续讨论之前我们需要清楚内核在写文件之前会对该文件加锁,不管是否成功完成写操作,在返回之前都会解锁。下面我们就以三种常见的文件根据SUS标准来讨论上面提出的这个问题:
1.普通文件 SUS中也没有说明在写普通文件时是否会保证是原子操作,但是它说明了write调用可能并不能完全把我们需要写入的数据写到文件中去,那么什么情况下可能少写数据呢?SUS说明了两种情况:磁盘已满或则要写入的文件的大小超过了当前进程的文件大小限制。其实至少还有一种情况,那就是内核中的高速缓存不够用的时候,比如linux内核在发现高速缓存不够用的时候就只写入实际能够容下的数据然后返回。正是由于存在上述最后一种情况,所以说按照APUE那种方法在linux下面写文件并不能保证我们的数据不会交错(不过我们可以根据write的返回值得知是否有发生交错的可能)。其它的unix内核可能会在实现上不同于linux内核,他们可能在写之前就判断一下缓冲区是否足够容纳所有数据,如果是这种情况,写操作应该就是原子的;也可能写了一部分数据后才发现缓冲区不够用并让当前进程进入睡眠状态,此时内核如果解锁,那么在当前进程睡眠期间其它进程可能写了数据,如果不解锁,那么就是原子操作,其他进程不可能在这个时候写入数据。由上面的分析可知,正是由于SUS标准不太完整的标准,我们不能确定一定可以按APUE的方法来同时向同一个普通文件写数据。如果我们非要在同一个文件中记录多个进程产生的数据,我们最好采用unix日志系统采用的方法,用一个专用进程处理文件IO,其它进程把需要写的数据发送给这个专用进程,这样应该比多个进程同时写一个文件可靠和高效。
(责任编辑:admin) |