深入探究Ubuntunvme

隨着雲計算、大數據等新興技術的快速發展,存儲技術也不斷更新迭代。NVMe(Non-Volatile Memory Express)是一種在PCIe總線上運行的新型存儲接口協議,相比傳統的SATA、SAS等存儲接口協議,NVMe在CPU與存儲介質之間加入了更快的通訊通道,能夠提供更高的存儲性能。而Ubuntunvme,則是基於Linux內核中NVMe驅動所提供的一種針對NVMe存儲器的通用文件系統。本文將從以下幾個方面對Ubuntunvme進行詳細的闡述。

一、系統架構

Ubuntunvme採用了NVMe標準接口協議,並嚴格遵循離線編程模式,包括NVMe命令集、NVMe隊列以及門鈴模式。由於NVMe所支持的CMD和Doorbell已經向上提供了共享內存,NVMe設備直接映射共享內存來實現命令環和設備環之間的通訊。而在NVMe驅動內核上層,Ubuntunvme使用了通用文件系統,並支持兩個主要函數:inode和dentry。


static const struct address_space_operations nvme_dax_aops = {
	.fault		= dax_noflush_fault,
	.writepage	= dax_writeback_mapping_range,
	.direct_io	= nvme_dax_direct_access,
};

在這段代碼中,可以看到Ubuntunvme使用了通用文件系統,並定義了dax_aops用於操作address_space,同時設置了三個操作:fault、writepage和direct_io。這些操作函數都是NVMe所支持的。

二、特點和應用

Ubuntunvme與傳統文件系統最大的不同,就是由NVMe命令集指定的直接讀寫,而不需要經過系統緩存區。這種基於直接讀寫的存儲方式,可以大大提高系統I/O性能,且具備以下特點:

1、高性能

由於Ubuntunvme能夠快速完成CMD和Doorbell之間的通訊,且不需要經過系統緩存區,因此能夠大幅提升系統I/O性能。這對於需要大量數據讀寫操作的應用場景,如大數據、機器學習等領域具有重要意義。

2、支持大容量存儲設備

相比傳統的存儲協議,NVMe協議支持更大的LBA尋址空間,能夠支持16TB以上的存儲設備。而Ubuntunvme也能夠完美支持這些大容量存儲設備,並保持較高的性能。

3、較低的主機CPU和內存負載

由於Ubuntunvme是直接操作存儲設備的文件系統,因此相比隨系統加載的傳統文件系統,其啟動時無需佔用大量的內存空間,大大降低了系統的CPU和內存負載。

三、示例代碼

以下是一個基於Ubuntunvme的示例程序,用於讀寫NVMe設備。示例代碼採用C語言編寫,並使用了DPDK庫函數。


#include <rte_mbuf.h>
#include <rte_ethdev.h>
#include <rte_distributor.h>
#include <rte_ring.h>
#include <rte_malloc.h>
#include <rte_eal.h>

#define NUM_MBUFS 8191
#define MBUF_CACHE_SIZE 250
#define RX_RING_SIZE 1024
#define TX_RING_SIZE 1024

#define BURST_SIZE 32

static const struct rte_eth_conf port_conf_default = {
	.rxmode = {
		.max_rx_pkt_len = ETHER_MAX_LEN,
	},
};

static struct rte_eth_dev_tx_buffer *buffer;

struct rte_mempool *mbuf_pool;

static inline uint16_t
add_bonded_device(const char *devargs, uint8_t port_id,
		  uint32_t numa_node)
{
	struct rte_eth_conf port_conf = port_conf_default;
	struct rte_eth_dev_info dev_info;
	struct rte_eth_link link;

	uint16_t nb_queues = rte_eth_dev_count_avail();

	if (!nb_queues) {
		RTE_LOG(ERR, APP, "No ethdev ports available\n");
		return 0;
	}
	int ret = rte_eth_dev_configure(port_id, nb_queues, nb_queues, &port_conf);
	if (ret < 0) {
		RTE_LOG(ERR, APP,
			"Cannot configure device: "
			"err=%d, port=%d\n",
			ret, port_id);
		return 0;
	}
	rte_eth_dev_info_get(port_id, &dev_info);
	rte_eth_link_get(port_id, &link);

	struct rte_eth_rxconf rx_conf;
	struct rte_eth_txconf tx_conf;

	rx_conf = dev_info.default_rxconf;
	tx_conf = dev_info.default_txconf;
	tx_conf.txq_flags = ETH_TXQ_FLAGS_IGNORE;

	uint16_t q;
	for (q = 0; q < nb_queues; q++) {
		ret = rte_eth_rx_queue_setup(port_id, q, RX_RING_SIZE,
					     numa_node, &rx_conf, mbuf_pool);
		if (ret < 0) {
			RTE_LOG(ERR, APP, "Cannot allocate rx queue: err=%d,"
				" port=%d\n", ret, port_id);
			return 0;
		}

		ret = rte_eth_tx_queue_setup(port_id, q, TX_RING_SIZE,
					      numa_node, &tx_conf);
		if (ret < 0) {
			RTE_LOG(ERR, APP, "Cannot allocate tx queue: err=%d,"
				" port=%d\n", ret, port_id);
			return 0;
		}

		buffer = rte_zmalloc_socket(NULL,
				RTE_ETH_TX_BUFFER_SIZE(BURST_SIZE), 0,
				rte_eth_dev_socket_id(port_id));
		if (buffer == NULL) {
			RTE_LOG(ERR, APP,
				"Cannot allocate buffer for tx on port %u\n",
				port_id);
			return 0;
		}

		ret = rte_eth_tx_buffer_init(buffer, BURST_SIZE);
		if (ret = 0, "Cannot init EAL\n");
}

int main(int argc, char **argv)
{
	dpdk_init();
	mbuf_pool = rte_pktmbuf_pool_create("MBUF_POOL",
		NUM_MBUFS * rte_eth_dev_count_avail(),
		MBUF_CACHE_SIZE, 0, RTE_MBUF_DEFAULT_BUF_SIZE, rte_socket_id());

	uint8_t port_id = 0;
	uint32_t numa_node = rte_socket_id();
	int nb_queues = add_bonded_device(NULL, port_id, numa_node);

	if (!nb_queues) {
		RTE_LOG(ERR, APP, "Cannot create bonded device\n");
		return 0;
	}

	printf("Hello, Ubuntunvme!\n");

	return 0;
}

這段代碼主要用於創建DPDK虛擬網絡設備並進行綁定,然後使用Ubuntunvme進行NVMe設備上的數據讀寫操作。其中,rte_eal_init用於初始化DPDK環境,rte_pktmbuf_pool_create用於創建DPDK內存池,add_bonded_device用於創建虛擬網絡設備。這些操作都是Ubuntunvme的API,能夠方便地對NVMe設備進行操作。

原創文章,作者:UPEMF,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/368946.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
UPEMF的頭像UPEMF
上一篇 2025-04-12 13:00
下一篇 2025-04-12 13:00

相關推薦

  • 深入解析Vue3 defineExpose

    Vue 3在開發過程中引入了新的API `defineExpose`。在以前的版本中,我們經常使用 `$attrs` 和` $listeners` 實現父組件與子組件之間的通信,但…

    編程 2025-04-25
  • 深入理解byte轉int

    一、位元組與比特 在討論byte轉int之前,我們需要了解位元組和比特的概念。位元組是計算機存儲單位的一種,通常表示8個比特(bit),即1位元組=8比特。比特是計算機中最小的數據單位,是…

    編程 2025-04-25
  • 深入理解Flutter StreamBuilder

    一、什麼是Flutter StreamBuilder? Flutter StreamBuilder是Flutter框架中的一個內置小部件,它可以監測數據流(Stream)中數據的變…

    編程 2025-04-25
  • 深入探討OpenCV版本

    OpenCV是一個用於計算機視覺應用程序的開源庫。它是由英特爾公司創建的,現已由Willow Garage管理。OpenCV旨在提供一個易於使用的計算機視覺和機器學習基礎架構,以實…

    編程 2025-04-25
  • 深入了解scala-maven-plugin

    一、簡介 Scala-maven-plugin 是一個創造和管理 Scala 項目的maven插件,它可以自動生成基本項目結構、依賴配置、Scala文件等。使用它可以使我們專註於代…

    編程 2025-04-25
  • 深入了解LaTeX的腳註(latexfootnote)

    一、基本介紹 LaTeX作為一種排版軟件,具有各種各樣的功能,其中腳註(footnote)是一個十分重要的功能之一。在LaTeX中,腳註是用命令latexfootnote來實現的。…

    編程 2025-04-25
  • 深入剖析MapStruct未生成實現類問題

    一、MapStruct簡介 MapStruct是一個Java bean映射器,它通過註解和代碼生成來在Java bean之間轉換成本類代碼,實現類型安全,簡單而不失靈活。 作為一個…

    編程 2025-04-25
  • 深入探討馮諾依曼原理

    一、原理概述 馮諾依曼原理,又稱「存儲程序控制原理」,是指計算機的程序和數據都存儲在同一個存儲器中,並且通過一個統一的總線來傳輸數據。這個原理的提出,是計算機科學發展中的重大進展,…

    編程 2025-04-25
  • 深入了解Python包

    一、包的概念 Python中一個程序就是一個模塊,而一個模塊可以引入另一個模塊,這樣就形成了包。包就是有多個模塊組成的一個大模塊,也可以看做是一個文件夾。包可以有效地組織代碼和數據…

    編程 2025-04-25
  • 深入理解Python字符串r

    一、r字符串的基本概念 r字符串(raw字符串)是指在Python中,以字母r為前綴的字符串。r字符串中的反斜杠(\)不會被轉義,而是被當作普通字符處理,這使得r字符串可以非常方便…

    編程 2025-04-25

發表回復

登錄後才能評論