主頁 > 知識庫 > linux系統(tǒng)中文件I/O教程

linux系統(tǒng)中文件I/O教程

熱門標簽:解決方案 美團 外呼系統(tǒng) 硅谷的囚徒呼叫中心 家政服務網(wǎng)絡 百度競價點擊價格的計算公式 服務器配置 電話機器人搭建

linux 文件I/O教程(1)

一,文件描述符
對內(nèi)核而言,所以打開的文件都通過文件描述符引用。每個進程都有一些與之關聯(lián)的文件描述符。文件描述符是一個非負整數(shù)。當打開一個現(xiàn)有文件或創(chuàng)建一個新文件時,內(nèi)核向進程返回一個文件描述符。當讀或?qū)懸粋€文件時,使用open或creat返回的文件描述符標識該文件,將其作為參數(shù)傳送給read和write。

一般有三個以及打開的文件描述符,他們是:


復制代碼
代碼如下:

0:標準輸入 STDIN_FILENO
1:標準輸出 STDOUT_FILENO
2標準錯誤輸出 STDERR_FILENO

每行后面的符號常量是依從POSIX而定的。
open函數(shù)


復制代碼
代碼如下:

#include sys/types.h>
#include sys/stat.h>
#include fcntl.h>
int open(const char *pathname, int flags);
int open(const char *pathname, int flags,mode_t mode);

pathname是要打開或創(chuàng)建文件的名字。

flag用來定義打開文件所采取的的動作,必須調(diào)用以下模式之一
O_RDONLY, O_WRONLY,  O_RDWR分別代表只讀,只寫,讀寫方式打開。

open還可以包括以下可選模式的組合
O_APPEND:把寫入數(shù)據(jù)追加到文件的尾端
O_CREAT:若文件不存在,則創(chuàng)建它。使用此選項時,需要第三個參數(shù)mode,用其指定該新文件的訪問權(quán)限。
O_EXCL:如果同時指定了O_CREAT,而文件存在,則會出錯。用此可以測試一個文件是否存在,如果存在,則創(chuàng)建文件,這使測試和創(chuàng)建兩者成為一個原子操作。
O_TRUNC: 如果此文件存在,而且為只寫或讀寫成功打開,則將其長度截為0。

open返回的文件描述符一定是最小的未用描述符數(shù)值。這一點被某些應用程序用在標準輸入,標準輸出或標準錯誤輸出上。如,一個程序關閉了自己的標準輸出,然后再次調(diào)用open,文件描述符1就會被調(diào)用,并且標準輸出將被有效的重定向到另一個文件或設備。

POSIX規(guī)范還標準化了一個creat調(diào)用,此函數(shù)等效于
open(pathname,O_WONLY |O_CREAT | O_TRUNC, mode);

close函數(shù)
#include unistd.h>
int close(int fd);

close調(diào)用終止一個文件描述符fd與對應文件之間的關聯(lián)。文件描述符被釋放后并能重新使用。close調(diào)用成功返回0,出錯返回-1.

關閉一個文件時會釋放該進程加在文件上的所有記錄鎖。當一個進程終止時,內(nèi)核自動關閉它所有打開的文件。

lseek函數(shù)
每個打開的文件都有一個與其相關聯(lián)的”當前文件偏移量”。按系統(tǒng)默認情況,當打開一個文件時,除非指定O_APPEND選項,否則該偏移量被設置為0。lseek可以為一個打開的文件設置偏移量。


復制代碼
代碼如下:

#include sys/types.h>
#include unistd.h>
off_t lseek(int fd, off_t offset, intwhence);

offset用來指定位置,whence參數(shù)定義該偏移值的用法。whence可取以下值:


復制代碼
代碼如下:

SEEK_SET: The offset is set to offset bytes.
SEEK_CUR: The offset is set to its current locationplus offset bytes.
SEEK_END: The offset is set to the size of the fileplus offset bytes.

成功調(diào)用返回從文件頭到文件指針被設置處的字節(jié)偏移值,失敗返回-1。參數(shù)offset定義在sys/types.h>中。

當偏移量大于文件長度時,出現(xiàn)空洞,空洞不占用存儲區(qū)。

read函數(shù)


復制代碼
代碼如下:

#include unistd.h>
ssize_t read(int fd, void *buf, size_tcount);

將與文件描述符fd關聯(lián)的文件中讀入count個字符放到buf中。返回讀入的字節(jié)數(shù),它可能小于請求的字節(jié)數(shù)。如果read調(diào)用返回0,就表示未讀入任何數(shù)據(jù),已到達了文件尾。返回-1,就表示出錯。

write函數(shù)


復制代碼
代碼如下:

#include unistd.h>
ssize_t write(int fd, const void *buf,size_t count);

把緩沖區(qū)buf的前count個字節(jié)寫入與文件描述符fd相關聯(lián)的文件中。返回實際寫入的字節(jié)數(shù),通常與count值相同;否則表示出錯。出錯的一個常見原因是:磁盤已寫滿,或者超出了一個給定進程的文件長度限制。

實例:創(chuàng)建一個文件,寫入數(shù)據(jù),移動當前偏移量,在讀數(shù)據(jù)。


復制代碼
代碼如下:

#includeunistd.h> //unistd.h>必須最早出現(xiàn),因為它可能會影響到其他頭文件。#includestdio.h>
#includefcntl.h>
#includestring.h>
#includeerrno.h>
int main()
{
char* filename = ".//file";
char buf[100];
char buf1[5];
int fd;

printf("open a file to write\n");
if((fd = open(filename,O_RDWR|O_CREAT|O_TRUNC,S_IRUSR|S_IWUSR|S_IRGRP|S_IROTH ))==-1)
{
perror("cannot open file\n");
return 1;
}
printf("open file successfully!\n");
printf("input a string:");
gets(buf);
//write intofile
if(write(fd,buf,strlen(buf)) !=strlen(buf))
{
perror("cannot write intofile\n");
return 1;
}
close(fd);

printf("open file to read.\n");
if((fd=open(filename,O_RDONLY)) == -1)
{
perror("cannot open thefile.\n");
return 1;
}
if(lseek(fd,3,SEEK_SET) == -1)
{
perror("lseek erroe\n");
return 1;
}
//read from the file
if(read(fd,buf1,4)==-1)
{
perror("read error.\n");
return 1;
}
printf("read from file is%s\n",buf1);
close(fd);

return 0;
}

執(zhí)行與輸出結(jié)果:


復制代碼
代碼如下:

root@jb51:~$gcc -o io io.c
root@jb51:~$./io
open a file towrite
open filesuccessfully!
input a string:akxivbaslzkncxcasbxbwwvaidxbd
open file toread.
read from fileis ivba

linux 文件I/O教程(2)

下面介紹了linux中有關文件I/O的相關內(nèi)容,內(nèi)核使用三種數(shù)據(jù)結(jié)構(gòu)表示打開的文件,他們之間的關系決定了在文件共享方面一個進程對另一個進程可能產(chǎn)生的影響。

一,文件共享
內(nèi)核使用三種數(shù)據(jù)結(jié)構(gòu)表示打開的文件,他們之間的關系決定了在文件共享方面一個進程對另一個進程可能產(chǎn)生的影響。
1)  每個進程在進程表中都有一個記錄項,記錄項中包含一張打開文件描述表,可將其視為一個矢量,每個描述符占用一項。與每個文件描述符相關聯(lián)的是:
a)      文件描述符標志
b)      指向一個文件表項的指針
2)  內(nèi)核為所有打開文件維持一張文件表。每個文件表項包含:
a)      文件狀態(tài)標志(讀、寫、讀寫、添些、同步和阻塞等)
b)      當前文件偏移量
c)      指向文件v節(jié)點表項的指針
3)  每個打開文件(或設備)都有一個v節(jié)點(v-node)結(jié)構(gòu)。v節(jié)點包含了文件類型和對比文件進行各種操作的函數(shù)的指針。對于大多數(shù)文件,v節(jié)點還包含了該文件的i節(jié)點。i節(jié)點包含文件所有者、文件長度、文件所在的設備、指向文件實際數(shù)據(jù)塊在磁盤上所在位置的指針等。

打開文件的內(nèi)核數(shù)據(jù)結(jié)構(gòu)

如果兩個進程各自打開了同一個文件,則如圖2所示。假定第一個進程在文件描述符3打開上該文件,而另一個進程在文件描述符4上打開該文件。每個進程都得得到一個文件表項,但對一個給定的文件只有一個v節(jié)點表項。每個進程都有自己的文件表項的一個理由是:使每個進程都有自己對該問價的當前偏移量。

現(xiàn)在對前一節(jié)文件I/O(1)的幾個操作進一步說明:
1.  完成write之后,文件中當前偏移量即所增加的字節(jié)數(shù)。如果當前偏移量大于文件長度,則將i節(jié)點中當前文件長度設為當前文件偏移量。
2.  用O_APPEND打開一個文件,相應標志會被設置到文件狀態(tài)標識中。每次寫時,當前偏移量會被設置為i節(jié)點中的文件長度
3.  lseek定位到文件尾端時,則文件當前偏移量會被設置為當前文件長度。

可能有多個文件描述符指向同一文件表項。調(diào)用dup和fork時都能看到這一點。
多個進程讀同一文件能正確工作。但多個進程寫同一文件時,可能產(chǎn)生預期不到的后果。可以利用原子操縱避免這種情況。

原子操作
一般而言,原子操作指的是由多部組成的操作。如果該院自地執(zhí)行,要么執(zhí)行完所以步驟,要么一步也不執(zhí)行。
1.      添加至一個文件
考慮一個進程,它要講數(shù)據(jù)添加到一個文件尾端。早期UNIX不支持open,所以可以如下實現(xiàn):


復制代碼
代碼如下:

if(lseek(fd, 0L, 2)0)
err_sys(“lseekerror”);
if(write(fd, buf, 100) != 100)
err_sys(“writeerror”);

對于單個進程,這段程序能正常工作。但多個進程就不一定。結(jié)社進程A和B都對同一文件進行添加操作。每個進程都打開該文件,此時數(shù)據(jù)結(jié)構(gòu)之間關系如圖2中所示。假定A調(diào)用lseek,將A的當前偏移量設置為1500。進程B執(zhí)行l(wèi)seek也將其當前偏移量設為1500。然后B調(diào)用write,將當前偏移量增至1600。然后內(nèi)核又進行進程切換使進程A恢復運行,當A調(diào)用write時,從其當前偏移量1500處將數(shù)據(jù)寫入,將替換B剛寫入到該文件中的數(shù)據(jù)。

問題出在邏輯操作“定位到文件尾端處,然后寫“使用了兩個分開的函數(shù)調(diào)用。解決辦法是使這兩個操作成為一個原子操作。O_APPEND標識,使內(nèi)核每次對文件進行寫之前,都將進程當前偏移量設置到該文件的尾端處。

2.pread和pwrite函數(shù)
原子性地定位搜索和執(zhí)行I/0。


復制代碼
代碼如下:

#include unistd.h>
ssize_t pread(int fd, void *buf, size_tcount, off_t offset);
ssize_t pwrite(int fd, const void *buf,size_t count, off_t offset);
ssize_t pread(int fd, void *buf, size_tcount, off_t offset);
ssize_t pwrite(int fd, const void *buf,size_t count, off_t offset);

dup和dup2函數(shù)


復制代碼
代碼如下:

#include unistd.h>
int dup(int oldfd);
int dup2(int oldfd, int newfd);

上面兩個函數(shù)都可用來復制一個現(xiàn)存的文件描述符。

由dup返回的新文件描述符一定是當前可用文件描述符中的最小數(shù)值。用dup2則可以用newfd參數(shù)指定新描述符的數(shù)值。如果newfd已經(jīng)打開,則先將其關閉。如果newfd等于oldfd,則dup2返回newfd而不關閉它。

圖3.3顯示了這種情況。

假定我們的進程執(zhí)行了:

newfd = dup(1);

當此函數(shù)執(zhí)行時,假設下一個可用的描述符是3。因為這兩個描述符指向同一個文件表項,所以他們共享文件標志以及同一文件偏移量。

sync、fsync和fdatasync


復制代碼
代碼如下:

#include unistd.h>
void sync(void);
int fsync(int fd);
int fdatasync(int fd);

當將數(shù)據(jù)寫入文件時,內(nèi)核通常將數(shù)據(jù)復制到一個緩沖區(qū),直到緩沖區(qū)寫滿,再將緩沖區(qū)排路輸出隊列,然后等待其到達隊首,才進行實際的I/O操作。這種輸出防暑被稱為延遲寫。延遲寫減少了磁盤的讀寫次數(shù),但卻降低了文件內(nèi)容的跟新速度。當系統(tǒng)發(fā)生故障時,延遲寫可能造成文件跟新內(nèi)容的丟失。為了保證磁盤上實際文件系統(tǒng)與緩沖區(qū)高速緩存中內(nèi)容一致性,UNIX系統(tǒng)提供了sync、fsync和fdatasync 三個函數(shù)。

fcntl函數(shù)


復制代碼
代碼如下:

#include unistd.h>
#include fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );

可以改變已經(jīng)打開文件的性質(zhì)。

復制一個現(xiàn)有的描述符(cmd=F_DUPFD)
獲得或設置文件描述符(cmd=F_GETFD|F_SETFD)
獲得或設置文件狀態(tài)標志(cmd=F_GETFL|F_SETFL)
獲得或設置異步I/O所有權(quán)(cmd=F_GETOWN|F_SETOWN)
獲得或設置記錄鎖(cmd=F_GETLK|F_SETLK、F_SETLKW)

可以用fcntl函數(shù)設置文件狀態(tài),常用設置套接字描述符為非阻塞O_NONBLOCK

ioctl函數(shù)
#include sys/ioctl.h>
int ioctl(int d, int request, ...);

提供了一個用于控制設備及其描述符行為和配置底層服務的接口。

/dev/fd
打開文件/dev/fd/n等效于復制描述符n。

標簽:撫州 北海 南昌 烏蘭察布 防城港 邢臺 臨沂 韶關

巨人網(wǎng)絡通訊聲明:本文標題《linux系統(tǒng)中文件I/O教程》,本文關鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關。
  • 相關文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266