TC

Alisin ang mga HTML Tag — Libreng Online na Kasangkapan

Processed locally. No data stored. Free forever.
0 chars
Processing Settings

Ano ang Alisin ang mga tag ng HTML?

Ang kasangkapang Remove HTML Tags ay isang parsing utility na marahas na tinatanggal ang lahat ng markup language mula sa isang dokumento, iniiwan lamang ang purong plain text na madaling basahin ng tao. Kapag kinokopya ang nilalaman mula sa source code ng website, RSS feeds, o rich-text email editor, madalas na natatabunan ang teksto ng mga layer ng structural tags tulad ng , , at <span>.

Agad na tinatanggal ng kasangkapang ito ang mga bracket at ang code sa loob nito, habang dinidecode din ang mga HTML entity (tulad ng &amp; o &nbsp;) pabalik sa kanilang karaniwang karakter. Mahalaga ito para sa paglilinis ng web scraping.

Kailan gamitin Alisin ang mga tag ng HTML?

Gamitin ang kasangkapang ito kapag nag-e-extract ng nilalaman mula sa mga dataset ng web scraping, mga paglalarawan ng RSS feed, o mga hilaw na HTML email file. Ginagamit ito ng mga espesyalista sa SEO upang makuha ang purong teksto mula sa source code ng pahina ng kakumpitensya at ipasa sa Keyword Density Checker.

Ginagamit ito ng mga administrator ng CMS upang ayusin ang mga artikulo kung saan ang sirang HTML code ay nakakaapekto sa visual na display. Kung kinopya mo ang teksto nang biswal mula sa isang web page at nais mo lamang alisin ang mga hindi nakikitang bakas ng pag-format, maaaring mas angkop ang mas malawak na Plain Text Converter.

Paano gamitin ang tool na ito

  1. 1Paste your HTML code or HTML-laden text
  2. 2Click 'Remove HTML Tags'
  3. 3Copy the clean plain text output

Ang kasangkapang ito ay tumutuon sa anumang nasa loob ng mga angle bracket (<tag>). Mag-ingat: kung mayroon kang tekstong matematikal tulad ng 'x < y', ang mga pangunahing HTML stripper ay maaaring magkamaling burahin ang lahat ng nasa kanan ng tanda na mas mababa.

Mga Halimbawa

InputOutput
<p>Hello <b>World</b></p>Hello World
<h1>Title</h1><p>Body text</p>TitleBody text
Price &amp; Tax: &lt;$100&gt;Price & Tax: <$100>
<ul><li>Item 1</li><li>Item 2</li></ul>Item 1Item 2
<script>alert('xss')</script>safe textsafe text

Mga Panuntunan at Gawi

  • Ang anumang teksto na nakapaloob sa mga angle bracket (hal., , , <img src='...'>) ay itinuturing na isang HTML tag at ganap na binubura.
  • Ang kasangkapang ito ay nagdedekod ng mga karaniwang HTML entity pabalik sa nababasang teksto. Halimbawa, ang &amp; ay nagiging &, ang &lt; ay nagiging <, at ang &copy; ay nagiging ©.
  • Ang teksto na nasa labas ng mga bracket—ang aktwal na nababasang nilalaman ng pahina sa web—ay pinananatili sa orihinal nitong ayos.

Mga Kaugnay na Tool

Mga Madalas Itanong

Bakit kailangan kong alisin ang mga HTML tag?

Kapag kinopya mo ang hilaw na source code mula sa isang webpage o gumamit ka ng script para mangalap ng datos, napupuno ng mga tagubiling pang-pormat ang mahahalagang teksto (tulad ng <b> para sa bold o <a href='...'> para sa mga link). Ang pagtanggal ng mga HTML tag ay nag-aalis ng 'code' at iniiwan sa iyo ang aktwal na artikulo o datos na nais mong basahin o suriin.

Nai-decode ba nito ang mga HTML entity?

Oo. Gumagamit ang mga web browser ng mga tiyak na code upang ipakita ang mga espesyal na karakter (halimbawa, kapag in-type ang &amp; sa code, lumalabas ang simbolong '&' sa pahina). Hindi lamang tinatanggal ng kasangkapang ito ang mga istrukturang <tag>, kundi isinasalin din nito ang mga naka-encode na entidad pabalik sa karaniwang, nababasang bantas.

Aalisin ba nito ang JavaScript?

Ang isang mataas na kalidad na HTML stripper ay tinatanggal ang mga <script> tag at ang programming code na nakapaloob sa pagitan nila, dahil ang JavaScript code ay hindi teksto na mababasa ng tao. Sa katulad na paraan, karaniwang tinatanggal din ang CSS code na matatagpuan sa pagitan ng mga <style> tag.

Paano ito naiiba sa paglikha ng simpleng teksto?

Plain Text conversion karaniwang humahawak ng datos mula sa clipboard—tinatanggal ang pag-format na bold, italic, at font-size mula sa teksto na kinopya mo mula sa Word o mula sa isang rendered na webpage. Ang pagtanggal ng mga HTML tag ay partikular para sa paglilinis ng hilaw na source code string.

Matatanggal ba ang mga ekwasyong matematika ko?

Maaaring ganoon nga. Dahil umaasa ang mga HTML tag sa mga simbolo ng mas mababa sa (<) at mas mataas sa (>), maaaring makita ng isang simpleng stripper ang 'A < B at C > D' at magkamaling isipin na ang '< B at C >' ay isang kakaibang HTML tag, kaya ito ay mabubura. Laging suriin ang mga teksto na may maraming matematika o code pagkatapos ng pag-strip.