Простая утилита для очистки HTML кода от мусора.

Внеплановый пост...


Так как редактор блогспота очень странно работает с форматированием, пришлось накатать скриптик. Поделюсь с общественностью.

Я пишу тексты в Libre Office, раньше в Open Office, и регулярно встает проблема нормального экспорта в html формат, без всякого мусора типа стилей, тегов <font> и <span> и лишних параметров.

Скрипт написан на коленке, под мои задачи. Язык весьма экзотический в вебмастерских кругах — AutoIt. Экзешник есть, исходник приложил, для желающих что-то допилить или поржать над кодом. Примеры и инструкция там же.

Что делает утилита:

  • Удаляет все что идет до тега <body> и после </body> включая сами теги.

  • Удаляет теги <font> и <span> полностью.

  • Удаляет параметры и стили из тегов: <p>, <h1-h6>, <ul>,<ol>,<li>

  • Другие теги не обрабатываются, пустые абзацы оставляются как есть.

Желающие велком - качаем.

Как использовать:

Заморачиваться с разбором форматов офисных пакетов было лень, да и универсальность бы понизилась, поэтому:

  • Из Open Office или Libre Office экспортируете файл в html. Можно через - "сохранить как" - результат одинаковый (Что получается после экспорта из Word'а не проверял)

  • Запускаете скрипт, выбираете полученный файл, скрипт чистит его от мусора и помещает результат в буфер обмена. Можно сразу через Ctrl+V вставлять в редакотор админки.


Upd: Посмотрел "реформатор" из комментов, штука отличная, наткнулся бы на него, писать свое бы не стал. А так пусть останется. Решение моих задач скриптом чуть удобнее и быстрее получается. Но типографики нет, да. Зато оффлайн можно текстов наготовить.


Комментарии

  1. reformator чем не устраивает?

    ОтветитьУдалить
    Ответы
    1. Хотя бы тем, что я о нем не знал, поверхностное гугление дало кучу клинеров и онлайн сервисов, и все мимо. Проще и быстрее оказалось свой написать за 20 минут, чем перебирать все подряд.

      Удалить
    2. Но за наводку спасибо, гляну.

      Удалить
  2. Можно проще :)
    Я все тексты пишу в редакторе Visual Studio Code или Atom, так получается чистый текст без мусора текстовых редакторов :)

    ОтветитьУдалить
    Ответы
    1. Редактор Visual Studio Code позволяет делать структуру текста? Заголовки, списки? Или сразу писать с html кодом? На любителя решение.

      Удалить
    2. КушатьХочу27 июня 2019 г., 21:08

      Думаю речь идёт о markdown'е. Попробуй typora

      Удалить
    3. Сначала пишу абзацами текст, затем размечаю HTML тегами (заголовки, списки и т.д.)
      Еще бывает пишу статью в evernote, а затем в Visual Studio Code уже размечаю HTML тегами и закидываю на сайт.

      Удалить
    4. КушатьХочу28 июня 2019 г., 11:44

      Зачем усложнять? Пишешь в любом markdown редакторе (ghostwriter например) и просто копируешь как html прям из окна редактирования

      Удалить

Отправить комментарий

Пиши осмысленно. (Кроме Seoonly, ему, как пресонажу былинному, разрешается оставлять "нейтральные" комментарии)