主頁(yè) > 知識(shí)庫(kù) > ubuntu12.04環(huán)境下使用kvm ioctl接口實(shí)現(xiàn)最簡(jiǎn)單的虛擬機(jī)

ubuntu12.04環(huán)境下使用kvm ioctl接口實(shí)現(xiàn)最簡(jiǎn)單的虛擬機(jī)

熱門(mén)標(biāo)簽:呼叫中心 大數(shù)據(jù)分析 電話銷(xiāo)售團(tuán)隊(duì) 呼叫外包 電銷(xiāo)機(jī)器人 智能手機(jī) Mysql連接數(shù)設(shè)置 科大訊飛語(yǔ)音識(shí)別系統(tǒng)

qemu、virtual box、vmware、xen都是虛擬機(jī),一般用戶接觸到的virtual box和vmware比較多,都是用來(lái)ubuntu中跑windows,或者windows中跑ubuntu的。

qemu其實(shí)是鼎鼎大名的最基礎(chǔ)的開(kāi)源模擬器,可以純軟件模擬x86、arm、mips,這一點(diǎn)完虐其它模擬器;也可以使用硬件加速,比如linux下kvm和windows以及mac下的haxm。這些硬件加速又是基于initel VT-x, intel VT-d,以及amd對(duì)應(yīng)的技術(shù),這些技術(shù)提供了vCPU,以及硬件的影子頁(yè)表(intel EPT),大大減輕了qemu軟件模擬的工作量。

virtual box,qemu-kvm都使用到了qemu,但是僅僅用到了它的設(shè)備模擬功能。qemu對(duì)于gpu的模擬比較渣,所以基于qemu的Android emulator自己實(shí)現(xiàn)了opengles 的qemu pipe,使用host電腦上的opengl進(jìn)行繪圖。
xen在云計(jì)算中用的比較多,在這里不做詳細(xì)介紹。其它模擬器基本都是運(yùn)行在普通操作系統(tǒng)之上的一個(gè)進(jìn)程,每一個(gè)核是其中的一個(gè)線程。

本文介紹kvm的使用,在intel平臺(tái)下ubuntu12.04中實(shí)現(xiàn)一個(gè)最簡(jiǎn)單的模擬器,計(jì)算2+2的結(jié)果并通過(guò)io端口輸出。

內(nèi)核中kvm api的介紹可以看:Documentation/virtual/kvm/api.txt,其它的一些文檔:Documentation/virtual/kvm/。完整的源碼:https://lwn.net/Articles/658512/。

使用kvm的真正的虛擬機(jī),模擬了很多虛擬的設(shè)備和固件,還有復(fù)雜的初始化狀態(tài)(各個(gè)設(shè)備的初始化,CPU寄存器的初始化等),以及內(nèi)存的初始化。本文所述的模擬器demo,將使用如下16bit的x86的代碼(為什么是16bit呢,因?yàn)閤86一上電是實(shí)模式,工作于16bit;之后再切換到32bit的保護(hù)模式的):

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. mov $0x3f8, %dx     
  2. add %bl, %al     
  3. add $'0', %al     
  4. out %al, (%dx)     
  5. mov $'\n', %al     
  6. out %al, (%dx)     
  7. hlt    

這段代碼充當(dāng)了guest os,基本上算是一個(gè)裸奔的系統(tǒng)了。它實(shí)現(xiàn)了2+2,然后再加上'0',把4轉(zhuǎn)為ascii的'4',并通過(guò)端口0x3f8輸出。然后再輸出了'\n',就關(guān)機(jī)了。

我們把這段代碼對(duì)應(yīng)的二進(jìn)制存到數(shù)組里面:

Ruby Code復(fù)制內(nèi)容到剪貼
  1.   const uint8_t code[] = {     
  2. 0xba, 0xf8, 0x03, /* mov $0x3f8, %dx */     
  3. 0x00, 0xd8,       /* add %bl, %al */     
  4. 0x04, '0',        /* add $'0', %al */     
  5. 0xee,             /* out %al, (%dx) */     
  6. 0xb0, '\n',       /* mov $'\n', %al */     
  7. 0xee,             /* out %al, (%dx) */     
  8. 0xf4,             /* hlt */     
  9.    };    

怎么得到這些機(jī)器碼呢?

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. shuyin.wsy@10-101-175-19:~$ cat simple_os.asm     
  2.     mov $0x3f8, %dx     
  3.     add %bl, %al     
  4.     add $'0', %al     
  5.     out %al, (%dx)     
  6.     mov $'\n', %al     
  7.     out %al, (%dx)     
  8.     hlt     
  9. shuyin.wsy@10-101-175-19:~$ as -o simple_os.o simple_os.asm     
  10. shuyin.wsy@10-101-175-19:~$ objdump -d  simple_os.o     
  11. simple_os.o:     file format elf64-x86-64     
  12. Disassembly of section .text:     
  13. 0000000000000000 .text>:     
  14.    0:   66 ba f8 03             mov    $0x3f8,%dx     
  15.    4:   00 d8                   add    %bl,%al     
  16.    6:   04 30                   add    $0x30,%al     
  17.    8:   ee                      out    %al,(%dx)     
  18.    9:   b0 0a                   mov    $0xa,%al     
  19.    b:   ee                      out    %al,(%dx)     
  20.    c:   f4                      hlt    

可以在這個(gè)網(wǎng)頁(yè)上查看匯編指令,以及對(duì)應(yīng)的機(jī)器碼:http://x86.renejeschke.de/
注意開(kāi)頭多了一個(gè)0x66,解釋如下:

http://wiki.osdev.org/X86-64_Instruction_Encoding里面的Prefix group 3

所以我們需要在simple_os.asm文件的開(kāi)頭添加.code16,這樣的話就對(duì)了,但是objdump顯示的又不對(duì)了,需要這樣使用才行:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. shuyin.wsy@10-101-175-19:~$ objdump -d -Mintel,i8086 simple_os.o     
  2. simple_os.o:     file format elf64-x86-64     
  3. Disassembly of section .text:     
  4. 0000000000000000 .text>:     
  5.    0:   ba f8 03                mov    dx,0x3f8     
  6.    3:   00 d8                   add    al,bl     
  7.    5:   04 30                   add    al,0x30     
  8.    7:   ee                      out    dx,al     
  9.    8:   b0 0a                   mov    al,0xa     
  10.    a:   ee                      out    dx,al     
  11.    b:   f4                      hlt     
  12. https://sourceware.org/binutils/docs/as/i386_002d16bit.html   
  13. http://stackoverflow.com/questions/1737095/how-do-i-disassemble-raw-x86-code  

我們會(huì)把這段代碼,放到虛擬物理內(nèi)存,也就是GPA(guest physical address)的第二個(gè)頁(yè)面中(to avoid conflicting with a non-existent real-mode interrupt descriptor table at address 0),防止和實(shí)模式的中斷向量表沖突。al和bl初始化為2,cs初始化為0,ip指向第二個(gè)頁(yè)面的起始位置0x1000。
除此之外,我們還有一個(gè)虛擬的串口設(shè)備,端口是0x3f8,8bit,用于輸出字符。

為了實(shí)現(xiàn)一個(gè)虛擬機(jī),我們首先需要打開(kāi)/dev/kvm:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. kvm = open("/dev/kvm", O_RDWR | O_CLOEXEC);    

在使用kvm之前,需要使用KVM_GET_API_VERSION ioctl()去檢查下kvm的版本是否正確,看看是否為api12,是才可以繼續(xù)運(yùn)行

Ruby Code復(fù)制內(nèi)容到剪貼板
  1.  ret = ioctl(kvm, KVM_GET_API_VERSION, NULL);     
  2.    if (ret == -1)     
  3. err(1, "KVM_GET_API_VERSION");     
  4.    if (ret != 12)     
  5. errx(1, "KVM_GET_API_VERSION %d, expected 12", ret);    

檢查完api版本后,可以使用KVM_CHECK_EXTENSION ioctl()去檢查其它extensions是否可用,比如KVM_SET_USER_MEMORY_REGION,用來(lái)檢查kvm是否支持硬件影子頁(yè)表(http://royluo.org/2016/03/13/kvm-mmu-virtualization/):

Ruby Code復(fù)制內(nèi)容到剪貼板
  1.  ret = ioctl(kvm, KVM_CHECK_EXTENSION, KVM_CAP_USER_MEMORY);     
  2.    if (ret == -1)     
  3. err(1, "KVM_CHECK_EXTENSION");     
  4.    if (!ret)     
  5. errx(1, "Required extension KVM_CAP_USER_MEM not available");   

然后再創(chuàng)建一個(gè)虛擬機(jī)vm,這個(gè)vm和內(nèi)存,設(shè)備,所有的vCPU相關(guān),在host系統(tǒng)中對(duì)應(yīng)一個(gè)進(jìn)程:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. vmfd = ioctl(kvm, KVM_CREATE_VM, (unsigned long)0);    

虛擬機(jī)需要一些虛擬物理內(nèi)存,用來(lái)存放guest os。當(dāng)guest os進(jìn)行內(nèi)存訪問(wèn)時(shí),如果缺頁(yè),kvm會(huì)根據(jù)KVM_SET_USER_MEMORY_REGION的設(shè)置,去嘗試解決缺頁(yè)的問(wèn)題,如果kvm無(wú)法解決,就會(huì)退出,退出原因是KVM_EXIT_MMIO,然后由qemu或者其它東西去進(jìn)行設(shè)備的模擬(《android qemu-kvm內(nèi)存管理和IO映射》)。

我們先在host中申請(qǐng)一頁(yè)內(nèi)存,然后把guest os裸奔的代碼拷貝過(guò)去:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. mem = mmap(NULL, 0x1000, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0);     
  2. memcpy(mem, code, sizeof(code));    

然后我們需要把host 虛擬空間的內(nèi)存和guest os虛擬物理內(nèi)存的映射關(guān)系使用KVM_SET_USER_MEMORY_REGION ioctl()告知kvm:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. struct kvm_userspace_memory_region region = {     
  2. .slot = 0,     
  3. .guest_phys_addr = 0x1000,     
  4. .memory_size = 0x1000,     
  5. .userspace_addr = (uint64_t)mem,     
  6.    };     
  7.    ioctl(vmfd, KVM_SET_USER_MEMORY_REGION, ®ion);    

這樣,當(dāng)guest os訪問(wèn)到虛擬物理內(nèi)存的0x1000~0x2000之間的話,kvm會(huì)直接訪問(wèn)到mem所對(duì)應(yīng)的真實(shí)的物理內(nèi)存。

現(xiàn)在,我們有了一個(gè)虛擬機(jī)vm,有了一些虛擬物理內(nèi)存,內(nèi)存里面有g(shù)uest os的代碼,那么我們需要給虛擬機(jī)添加一個(gè)核(vCPU),對(duì)應(yīng)一個(gè)線程。當(dāng)然也可以多核(vCPUs,調(diào)用多次KVM_CREATE_VCPU):

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. vcpufd = ioctl(vmfd, KVM_CREATE_VCPU, (unsigned long)0);    

每一個(gè)vCPU都和一個(gè)kvm_run結(jié)構(gòu)體相關(guān),kvm_run用于內(nèi)核態(tài)和用戶態(tài)信息的同步,比如從用戶態(tài)的虛擬機(jī)中獲得內(nèi)核態(tài)的kvm退出的原因,KVM_EXIT_MMIO, KVM_EXIT_IO之類(lèi)的。先獲得kvm_run結(jié)構(gòu)體的大小,然后分配內(nèi)存并和vCPU進(jìn)行綁定:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. mmap_size = ioctl(kvm, KVM_GET_VCPU_MMAP_SIZE, NULL);     
  2. run = mmap(NULL, mmap_size, PROT_READ | PROT_WRITE, MAP_SHARED, vcpufd, 0);    

vCPU中還有處理器寄存器的狀態(tài),分為兩組,struct kvm_regs和struct kvm_sregs,我們需要設(shè)置其中的cs,al,bl,ip等寄存器:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. ioctl(vcpufd, KVM_GET_SREGS, sregs);     
  2. sregs.cs.base = 0;     
  3. sregs.cs.selector = 0;     
  4. ioctl(vcpufd, KVM_SET_SREGS, sregs);     
  5.   
  6.    struct kvm_regs regs = {     
  7. .rip = 0x1000,     
  8. .rax = 2,     
  9. .rbx = 2,     
  10. .rflags = 0x2,     
  11.    };     
  12.    ioctl(vcpufd, KVM_SET_REGS, ®s);    


好了,東西都準(zhǔn)備好了,我們可以開(kāi)始運(yùn)行vCPU了:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1.    while (1) {     
  2. ioctl(vcpufd, KVM_RUN, NULL);     
  3. switch (run->exit_reason) {     
  4. /* Handle exit */     
  5. }     
  6.    }    

我們需要根據(jù)run->exit_reason來(lái)處理kvm的退出狀態(tài),比如guest 關(guān)機(jī):

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. case KVM_EXIT_HLT:     
  2.  puts("KVM_EXIT_HLT");     
  3.  return 0;    

初始化失?。?/p>

Ruby Code復(fù)制內(nèi)容到剪貼板
  1.  case KVM_EXIT_FAIL_ENTRY:     
  2.   errx(1, "KVM_EXIT_FAIL_ENTRY: hardware_entry_failure_reason = 0x%llx",     
  3. (unsigned long long)run->fail_entry.hardware_entry_failure_reason);      
  4.  case KVM_EXIT_INTERNAL_ERROR:     
  5.   errx(1, "KVM_EXIT_INTERNAL_ERROR: suberror = 0x%x",     
  6.        run->internal.suberror);    

以及需要進(jìn)行設(shè)備的模擬器,在這里,只有一個(gè)端口為0x3f8的串口設(shè)備。模擬設(shè)備的效果就是把字符打印出來(lái):

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. case KVM_EXIT_IO:     
  2.         if (run->io.direction == KVM_EXIT_IO_OUT      
  3.             run->io.size == 1      
  4.             run->io.port == 0x3f8      
  5.             run->io.count == 1)     
  6.         putchar(*(((char *)run) + run->io.data_offset));     
  7.         else     
  8.         errx(1, "unhandled KVM_EXIT_IO");     
  9.         break;    

測(cè)試結(jié)果:

Ruby Code復(fù)制內(nèi)容到剪貼板
  1. tree@tree-OptiPlex-7010:~/Desktop$ gcc -o kvmtest kvmtest.c     
  2. tree@tree-OptiPlex-7010:~/Desktop$ ./kvmtest      
  3. KVM_EXIT_HLT    

qemu-kvm中,qemu的主要任務(wù)就是KVM_EXIT_IO, KVM_EXIT_MMIO之后的虛擬設(shè)備的模擬,以及KVM_RUN之前設(shè)置好相關(guān)的設(shè)備的東西并進(jìn)行初始化。

以上所述是小編給大家介紹的ubuntu12.04環(huán)境下使用kvm ioctl接口實(shí)現(xiàn)最簡(jiǎn)單的虛擬機(jī),希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!

標(biāo)簽:婁底 連云港 廊坊 濟(jì)寧 普洱 三沙 丹東 安慶

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《ubuntu12.04環(huán)境下使用kvm ioctl接口實(shí)現(xiàn)最簡(jiǎn)單的虛擬機(jī)》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266