前幾天,我手裡的一個項目需要將富文本的所有 html 標籤全部刪除,得到純文本後再存儲到數據庫中。在一系列得搜索操作之後,我找到了實現這個目的的幾種方法,在這裡我分享給大家,當你遇到同樣的情況興許也能用的上。
1. 使用 .replace(/<[^>]*>/g, ”)
這個方法是從文本中去除 html 標籤最簡單的方法。它使用字符串的方法 .replace(待替換的字符串,替換後的字符串) 將 HTML 標籤替換成空值。 /g 是表示替換字符串所有匹配的值,即字符串中所有符合條件的字符都將被替換。
這個方法的缺點是有些 HTML 標籤不能被剔除,不過它依然很好用。

2. 創建臨時DOM元素並獲取其中的文本
這種方法是完成該問題的最有效的方法。創建一個臨時 DOM 並給他賦值,然後我們使用 DOM 對象方法提取文本。

3. 使用 html-to-text npm 包
html-to-text 這個包的功能很全了,轉換也有許多的選項比如:wordwrap, tags, whitespaceCharacters , formatters 等等。
安裝:
npm install html-to-text使用:

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/275141.html
微信掃一掃
支付寶掃一掃