регулярное выражение для удаления URL из текста

Я хочу удалить все вхождения URL [полный путь, строка запроса] из текста в Python. Любые предложения о том, как это сделать? Я новичок в регулярном выражении!

http://example.com/url/?x=data

Весь этот URL должен быть удален! Спасибо


person kevin    schedule 18.12.2009    source источник
comment
Что появляется за пределами URL? Например, он всегда будет заканчиваться двойными или одинарными кавычками? Или космос?   -  person Skilldrick    schedule 18.12.2009


Ответы (3)


Это определенно нетривиальная задача, если вы хотите удалить любой действительный URL-адрес. Я бы взглянул на страницу Regex Lib по этой теме.

person theraccoonbear    schedule 18.12.2009


Пример удаления URL

<?php
    preg_match_all('/<a.*?href=".*?">(.*?)<[\/]a>/', $content,$arr);

    $new_content = str_replace($arr[0], $arr[1], $content);
    echo $new_content;
?>
person Shelly Chen    schedule 27.07.2016