Простая утилита для очистки HTML кода от мусора.

Внеплановый пост...


Так как редактор блогспота очень странно работает с форматированием, пришлось накатать скриптик. Поделюсь с общественностью.

Я пишу тексты в Libre Office, раньше в Open Office, и регулярно встает проблема нормального экспорта в html формат, без всякого мусора типа стилей, тегов <font> и <span> и лишних параметров.

Скрипт написан на коленке, под мои задачи. Язык весьма экзотический в вебмастерских кругах — AutoIt. Экзешник есть, исходник приложил, для желающих что-то допилить или поржать над кодом. Примеры и инструкция там же.

Что делает утилита:

  • Удаляет все что идет до тега <body> и после </body> включая сами теги.

  • Удаляет теги <font> и <span> полностью.

  • Удаляет параметры и стили из тегов: <p>, <h1-h6>, <ul>,<ol>,<li>

  • Другие теги не обрабатываются, пустые абзацы оставляются как есть.

Желающие велком - качаем.

Как использовать:

Заморачиваться с разбором форматов офисных пакетов было лень, да и универсальность бы понизилась, поэтому:

  • Из Open Office или Libre Office экспортируете файл в html. Можно через - "сохранить как" - результат одинаковый (Что получается после экспорта из Word'а не проверял)

  • Запускаете скрипт, выбираете полученный файл, скрипт чистит его от мусора и помещает результат в буфер обмена. Можно сразу через Ctrl+V вставлять в редакотор админки.


Upd: Посмотрел "реформатор" из комментов, штука отличная, наткнулся бы на него, писать свое бы не стал. А так пусть останется. Решение моих задач скриптом чуть удобнее и быстрее получается. Но типографики нет, да. Зато оффлайн можно текстов наготовить.


Комментарии

  1. Ответы
    1. Хотя бы тем, что я о нем не знал, поверхностное гугление дало кучу клинеров и онлайн сервисов, и все мимо. Проще и быстрее оказалось свой написать за 20 минут, чем перебирать все подряд.

      Удалить
    2. Но за наводку спасибо, гляну.

      Удалить
  2. Можно проще :)
    Я все тексты пишу в редакторе Visual Studio Code или Atom, так получается чистый текст без мусора текстовых редакторов :)

    ОтветитьУдалить
    Ответы
    1. Редактор Visual Studio Code позволяет делать структуру текста? Заголовки, списки? Или сразу писать с html кодом? На любителя решение.

      Удалить
    2. Думаю речь идёт о markdown'е. Попробуй typora

      Удалить
    3. Сначала пишу абзацами текст, затем размечаю HTML тегами (заголовки, списки и т.д.)
      Еще бывает пишу статью в evernote, а затем в Visual Studio Code уже размечаю HTML тегами и закидываю на сайт.

      Удалить
    4. Зачем усложнять? Пишешь в любом markdown редакторе (ghostwriter например) и просто копируешь как html прям из окна редактирования

      Удалить
  3. Мне не кажется что он усложняет,по моему вполне адекватная последовательность действий,каждому свое

    ОтветитьУдалить

Отправить комментарий

Пиши осмысленно. (Кроме Seoonly, ему, как пресонажу былинному, разрешается оставлять "нейтральные" комментарии)