使用Dockersuperset實現高效數據可視化

一、起步

對於數據可視化，Superset是一個非常方便的工具。而為了更快地和更有效地使用Superset，我們可以使用Driverless AI，這條路徑會讓我們體驗到數據科學家在構建複雜模型時所需要的一切。Driverless AI是H2O.ai提供的一個機器學習自動化工具，該工具旨在幫助客戶快速，高級地構建先進的AI模型。建立在Driverless AI之上的Superset被命名為dockersuperset。為了展示一個最小化的操作示例，Superset最稍顯複雜。

二、dockersuperset的部署

為了使用dockersuperset，我們首先需要在本地部署該工具。在這裡，我們使用Docker Compose來簡化部署過程。為了自動啟動dockersuperset，我們擁有一個名為docker-compose.yml的Docker Compose文件，該文件包含以下內容：

version: '3'
services:
  superset:
    image: amancevice/superset:latest
    container_name: superset
    restart: always
    ports:
      - 8088:8088
    environment:
      - SUPERSET_LOAD_EXAMPLES=yes
    volumes:
      - ./superset:/home/superset
      - ./data:/data

在上面的文本段落中，我們使用了amancevice/superset鏡像，使用8088埠啟動了容器，並在數據文件夾中使用文件數據。

三、dockersuperset的相關設置

接下來，我們需要輸入docker-compose up 命令，這將啟動上述docker-compose.yml文件中的所有服務。很快，Superset將在控制台輸出「Admin用戶創建」的消息。此時，我們可以立即從http://localhost:8088中使用Superset，登錄使用用戶名和密碼admin進行網站驗證。在登錄後，我們需要先配置資料庫連接，這可以通過左側欄中Database選項來完成。Superset支持多個不同的資料庫，包括MySQL，PostgreSQL和Microsoft SQL Server等資料庫。

Superset的一個強大功能是可視化元素，例如圖表，數據表和儀錶板。對於數據可視化，Superset提供了各種圖表類型，包括堆棧，多線圖表，面積圖和散點圖等等。所有這些都顯示在「儀錶板」選項卡上。同時，我們還可以在下拉列表中找到其他可視化元素，例如數據表或數字儀錶板。

Superset的另一個值得注意的特點是數據表的視覺編輯器。在Superset的許多版本中，用戶必須使用SQL編輯器來構建指向資料庫的查詢。但是，有了數據表可視化編輯器，用戶現在可以通過拖放表、列和連接來構建查詢，並使用「查看生成的SQL」複選框來查看最終生成的SQL語句。儀錶板圖還可以使用Markdown編輯器中的文本來添加互動式容器等元素。

四、啟用驅動器自動AI

現在我們已經可以使用Superset進行數據可視化了，但是如果需要更快的高級AI模型，我們需要Driverless AI。直接運行Drivarless AI是非常困難且需要更多的配置工作的。 Luckily，H2O.ai開發了一個名為driverlessai-superset插件的插件，可以通過其在Superset中訪問Driverless AI。

並非所有人都能夠在不了解其工作原理的情況下正確地安裝和使用Driverless AI。但是，我們可以通過使用driverlessai-superset插件來簡化這個繁瑣的任務。使用這種插件，我們可以在沒有任何額外工作的情況下訪問Driverless AI的所有設施。有了它，我們可以像使用任何其他Superset插件一樣使用Driverless AI，例如：在儀錶板中添加圖表並查看結果。我們可以在Superset的多個圖表類型中使用Driverless AI，例如普通圖表或高級數據科學家圖表等。

要啟用在Superset中使用Driverless AI，我們首先需要下載驅動程序。

H2O.ai為此提供了一個安裝腳本，該腳本可以在安裝完Driverless AI後使用。使用此腳本，我們可以簡單地啟用Superset和Driverless AI之間的通信。請注意，此腳本只需要在首次安裝Superset後使用一次。啟用插件後，我們將無需再次使用此腳本或其他工具。同時，您可以在一個步驟中使用pip install -U h2oai-client，因為所有pypi客戶端存儲庫都包含驅動程序。

五、總結

在本篇文章中，我們向大家展示了如何使用Superset進行數據可視化，以及如何使用driverlessai-superset插件訪問Highend AI模型的方法。要總結所討論的主題，我們建議使用Superset進行數據可視化，同時使用H2O.ai提供的Driverless AI在構建體系結構時進行補充。如此，我們可以利用當前最佳的AI和數據可視化技術，對我們關注的數據進行更高效且更有意義的可視化和分析。

原創文章，作者：WHRHB，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/333568.html