Рубрики
Утилиты

Автоматическая очистка HTML кода от “мусора”

Cleaner – сервис очистки тегов от “мусора”, который остается в документе после сохранения страницы в формате из программы .

html-cleaner

Давным давно я написал подобный плагин, но он был сделан на скорую руку, сейчас механизм полностью переписан.

Очистка кода происходит методом перебора введенной строки из которой формируется новая, содержащая “чистый” . Плагин удаляет абсолютно все из тегов, в том числе и из тегов . В непарных тегах проставляется символ /(слеш). Удаляются пустые теги, например конструкция <p></p> будет удалена, так как она ничего не содержит.

Как работает html cleaner?

Есть два способа:

  1. В программе MS Word выберите данные, которые хотите очистить от мусора, чтобы выбрать все, нажмите Ctrl + A. Вставьте скопированный текст в поле ниже(должна быть выбрана вкладка “Вставить данные MS Office”), нажмите кнопку “Готово”.
  2. Перед тем, как оптимизировать код выберите в Word “Сохранить как…”, далее укажите Тип файла “Веб-страница с фильтром”, затем откройте сохраненный файл в текстовом редакторе, скопируйте код и вставьте в поле ниже(должна быть выбрана вкладка “Вставить HTML”), нажмите кнопку “Готово”.

В результате Вы получите девственно чистый html код.
Не тронутыми остаются следующие атрибуты:

colspan, rowspan, href, src, type, value, lang, tabindex, title, code, alt, target, dir, span, action, method, style

Не забывайте оставлять свои комментарии, которые помогут мне исправить ошибки или сделать доработки.

Alex Isaenko

Автор: Alex Isaenko

Блоггер, разработчик, бизнесмен, коуч.

Добавить комментарий

144 ответа к “Автоматическая очистка HTML кода от “мусора””

Во-первых, спасибо Вам огромное за такую чудесную вещь))
По поводу доработок, было бы очень неплохо вынести те тэги, которые html cleaner оставляет, в столбец для того, чтобы можно было чистить ещё больше.
Например тэги . Они не всегда нужны, часто нужен полностью чистый код.
Спасибо огромное ещё раз))

Всё поменялось. Раньше были кнопки (обвел зеленым), выбрать что вставляешь HTML или данные из Office. А сейчас только HTML. То есть перед очисткой кода нужно сначала где-то сконвертировать текст из Офиса в HTML.
Плюс верстка сбилась (красным).