The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"SED для удаление ссылок из html-файла"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Программирование под UNIX (Shell скрипты)
Изначальное сообщение [ Отслеживать ]

"SED для удаление ссылок из html-файла"  +/
Сообщение от realovich (ok) on 14-Июн-10, 09:27 
Доброе время суток, знатоки!
У меня к вам вопрос:
как с помощью sed или других подобных инструментов удалить ссылки из html-документа.
То есть, мне нужно почистить документ от ссылок типа:
<a class="bla1-bla2-bla3" href="bla4-bla5-bla6">Ссылка</a>
и:
<a href="bla4-bla5-bla6">Ссылка</a>
Но содержимое тега оставить, то есть, грубо говоря, чтобы слово "Ссылка" - осталось.
Заранее премного благодарен!
Высказать мнение | Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "SED для удаление ссылок из html-файла"  +/
Сообщение от realovich (ok) on 14-Июн-10, 10:59 
забыл указать важный момент, что ссылка находится не на одной строке... А примерно так:
<a class="bla1-bla2-bla3"
href="bla4-bla5-bla6">Ссылка</a>

Высказать мнение | Ответить | Правка | ^ | Наверх | Cообщить модератору

2. "SED для удаление ссылок из html-файла"  +/
Сообщение от realovich (ok) on 14-Июн-10, 15:45 
Не дождался ответа, нашел, более или менее устраивающий меня вариант. Убирает непосредственно ссылку. Тег "a" остается, чтобы не выводился класс.

cat file0.htm | sed 's#href=\"?[^",]*\"##' > file1.htm

Высказать мнение | Ответить | Правка | ^ | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру