Рубрики
Утилиты

Автоматическая очистка HTML кода от “мусора”

HTML Cleaner – сервис очистки html тегов от “мусора”, который остается в документе после сохранения страницы в формате html из программы MS Word.

html-cleaner

Давным давно я написал подобный плагин, но он был сделан на скорую руку, сейчас механизм полностью переписан.

Очистка кода происходит методом перебора введенной строки из которой формируется новая, содержащая “чистый” код. Плагин удаляет абсолютно все из тегов, в том числе и из тегов html 5. В непарных тегах проставляется символ /(слеш). Удаляются пустые теги, например конструкция <p></p> будет удалена, так как она ничего не содержит.

Как работает html cleaner?

Есть два способа:

  1. В программе выберите данные, которые хотите очистить от мусора, чтобы выбрать все, нажмите Ctrl + A. Вставьте скопированный текст в поле ниже(должна быть выбрана вкладка “Вставить данные MS Office”), нажмите кнопку “Готово”.
  2. Перед тем, как оптимизировать выберите в Word “Сохранить как…”, далее укажите Тип файла “Веб-страница с фильтром”, затем откройте сохраненный файл в текстовом редакторе, скопируйте код и вставьте в поле ниже(должна быть выбрана вкладка “Вставить HTML”), нажмите кнопку “Готово”.

В результате Вы получите девственно чистый html код.
Не тронутыми остаются следующие атрибуты:

colspan, rowspan, href, src, type, value, lang, tabindex, title, code, alt, target, dir, span, action, method, style

Не забывайте оставлять свои комментарии, которые помогут мне исправить ошибки или сделать доработки.