Программа для создания sitemap.xml с поддержкой извлечения даты последнего изменения веб-страницы и учетом запретов в robots.txt. Написана на высокоуровневом языке программирования Python 3. Полностью на русском языке.
Особенности:
- создание карты сайта в формате xml;
- неограниченное количество url-адресов;
- поддержка кириллицы в домене и url-адресе;
- извлечение даты последнего изменения страницы;
- заполнение приоритетов и регулярности обновления на основании уровня вложенности;
- статистическая информация в режиме реального времени - количество обнаруженных ссылок и добавленных веб-страниц в sitemap.xml;
- поддержка списка игнорирования для исключения мусорных страниц (взято за основу из CMS Joomla);
- поддержка протоколов http и https;
- интерфейс переведен на английский и русский языки.
Карта сайта сохраняется в папке с исполняемым файлом программы под именем sitemap.xml. Предполагается, что данный файл по завершении процесса создания карты сайта можно будет сразу загрузить на хостинг.
Существуют более удобные для веб-мастера html карты сайта, так как их не нужно каждый раз создавать отдельной программой, но любой опытный SEO-специалист объяснит, что xml карта сайта имеет больший вес для поисковых систем и является одним из 1000 факторов, которые учитываются при ранжировании сайта. Это подтверждается официальной документацией поисковых систем Яндекс и Google.
Множество подобных программ имеют ограничения по количеству страниц, которые программа может добавить в sitemap.xml. Чаще всего такие программы имеют ограничения в 500 адресов, но XmlSitemapGenerator не имеет ограничений по количеству веб-страниц, поэтому может использоваться для создания карты сайта любого размера, и, что не менее важно, абсолютно бесплатно.
Поддерживается извлечение даты обновления или создания веб-страниц для заполнения тега <lastmod>. Программа ищет дату на странице по словам "Обновлено:", "Опубликовано:" и "Создано:". Также она умеет распознавать текстовые названия месяцев.
Теги <priority> и <changefreq> на основании уровня вложенности конкретной веб-страницы.
Для удобства отслеживания процесса создания sitemap в формате xml отображается статистика - количество обнаруженных ссылок и добавленных в карту веб-страниц. Она обновляется в режиме реального времени.
Список игнорирования исключает из карты мусорные страницы с '.jpg', '.png', '/user?id=', 'login', 'logout', 'redirect.php', '.exe', '.zip', '.msi', '.JPG', '.PNG', 'comment-', 'component', 'users', '.tar.bz2'.
Характеристики
Ссылки на официальный сайт и загрузку- Язык: Русский
- ОС: Windows 10, Windows 7
- Лицензия: GNU GPL v2
- Разработчик: Алексей Черемных
- Категория: Интернет - прочее
- Видеообзор: Отсутствует
- VirusTotal: отчет
- Подтверждение лицензии: Отсутствует
- Создано: 06.04.2021
- Обновлено: 07.06.2022
Alex
3 ноября 2021 г. 15:49
Хочу отметить очень разумный список игнорирования! Сразу видно, что человек сам использует свою программу и при написании делал её для себя. Именно такой подход позволяет создавать СДЛ программы. Для тех кто не в курсе, СДЛ означает сделано для людей. Смешно, но я согласен с StoneAl! Даже платные веб-сервисы криво работают с кириллицей :D у одного из моих клиентов тоже сайт с урлами на кириллице и он их менять не хочет. При этом, эти веб-сервисы платные, а бесплатно можно создать sitemap с количеством урлом до 500 :D. Кстати, сразу не заметил, но "учетом запретов в robots.txt" это круто, даже не у всех веб-сервисов такое есть! Специально проверил, и представляете, работает! =)))))
Тоня
3 ноября 2021 г. 7:44
Отличное приложение, спасибо!
StoneAl
2 ноября 2021 г. 22:41
Если программно на сайте нет возможности реализовать создание карты сайта, по тем или иным причинам (так бывает, вот прикол), то выясняется, что приложений для создания sitemap.xml крайне мало, и из них работающий еще меньше, насколько, что хватит пальцев рук, чтобы посчитать их. Вытаскивать дату со временем не умеет больше ни одно приложение, и кстати, XmlSitemapGenerator единственное приложение, которое работает с кириллицей! Все остальные помирали при встрече урла на кириллице. Да, да, урл на кириллице это жесть, но сейчас переделывать уже не вариант. В общем, данный генератор sitemap в формате xml решил все мои проблемы. Создаёт карту сайта по времени нормально (если считать в среднем по больнице, а так не быстро), поставил и забыл. Нагрузку на сайте не создаёт, и сомнительный траффик тоже.
Андрей
2 ноября 2021 г. 14:35
Прикольно, что он вытаскивает дату создания страницы! Нигде такого не видел! Хотя если говорить честно, для пары страниц он определил неправильную дату, но всё равно очень круто, так как в целом процент ошибок стремиться к нулю и практически ему равен.
Дмитрий
1 ноября 2021 г. 18:32
У меня Joomla. Раньше использовал компонент для создания карты сайта с датами обновлений страниц, но не смотря на частое обновление этого компонента меня всё равно постоянно ломали через него. В итоге отказался от всех сторонних компонентов и плагинов, как итог отсутствие взломов, однако, некоторые удобства ушли и приходится больше работать руками. Если смотреть через призму взлома, то это всё равно меньше, чем вручную переносить текст каждого материала на чистый движок. Поэтому передо мной стояла задача, найти такое приложение для создания sitemap xml, которое бы выставляло дату обновления или создания страницы, однако, тут появилась загвоздка. Все программы брали дату от веб-сервера апач, но он то от куда знает её? и он отдавал дату формирования веб-страницы, то есть типа страница появилась сейчас. Я был очень рад найти XmlSitemapGenerator, так как она берёт эту дату со страницы, а не от сервера! В моём случае, все даты оказались правильными! Круто, спасибо!
Стас
1 ноября 2021 г. 10:26
Очень классная софтина для создания sitemap xml! Максимально простая, и при это удобная. К чему крутой интерфейс, если программа не выполняет своих функций на нужном уровне, а тут она имеет простейший интерфейс и создаёт карту сайта без особо труда и на высочайшем уровне! Поэтому на оформление пофиг!
mrkaban
29 декабря 2020 г. 22:17
Известные ошибки: - при большом количестве добавленных страниц в текстовое поле может дёргаться скролл; - добавляет gif картинки в список страниц (необходимо добавить в список игнорирования).
mrkaban
28 декабря 2020 г. 22:27
if интерес > 1: активное развитие программы else: очень медленное развитие программы Иными словами, если будет интерес к этому генератору sitemap.xml, тогда буду активно развивать его. Иначе, буду его улучшить чисто для себя в образовательных целях.