Использование внедренного JavaScript для копирования текста с веб-страницы

В рамках работы, которую я выполняю на веб-сайте, мне нужно скопировать несколько тысяч строк текста с нескольких страниц старого сайта и вставить их в HTML-код нового сайта. Долгий и кропотливый путь перехода к старой странице и копирования многих строк текста, а затем перехода к моему редактору и вставки его туда строка за строкой становится действительно старым. Я думал об использовании встроенного JavaScript для этого, но я не совсем уверен, с чего начать. Заранее благодарю за любую помощь.

Вот ссылки на страницу старого сайта и страницу нового сайта. Как видно из таблиц на каждой странице, копирование всего вручную заняло бы уйму времени.

Старый сайт: http://temp.delridgelegalformscom.officelive.com/macorporation1.aspx

Новый сайт: http://ezwebsites.us/delridge/macorporation1.html


person Blake    schedule 17.12.2010    source источник
comment
Можете ли вы опубликовать HTML-код, чтобы рассказать нам о форматировании и тому подобном?   -  person Qix - MONICA WAS MISTREATED    schedule 17.12.2010
comment
Я только что добавил ссылки на 2 сайта, с которыми я работаю, к моему вопросу.   -  person Blake    schedule 18.12.2010
comment
У вас есть доступ к серверу? Почему бы вам просто не написать сценарий unix/dos, который копирует то, что вам нужно, с сайта?   -  person Juan Mendes    schedule 18.12.2010
comment
У меня нет доступа к серверу, это шаблон веб-сайта, и клиент хочет, чтобы сайт был переделан, чтобы у него была возможность изменить все, что он хочет. Кроме того, я не знал бы, как написать эфир сценария UNIX/dos.   -  person Blake    schedule 18.12.2010


Ответы (2)


Для выполнения такой работы вам потребуются две вещи: способ внедрения или выполнения сценария на этой странице и хорошее знание объектной модели документа для целевого сайта.

Я настоятельно рекомендую использовать плагин FireBug для Firefox или аналогичный инструмент в выбранном вами браузере. FireBug позволяет выполнять команды из консоли JavaScript, что может помочь. Будем надеяться, что на старом сайте нет кучи тегов <FONT>, <OBJECT> или <IFRAME>, которые сделают это еще более утомительным.

Использование библиотеки, такой как Prototype или JQuery, также поможет выбрать нужные вам части веб-сайта. Вы можете отправить результаты с помощью JQuery следующим образом:

$(function() {
    snippet = $('#content-id').html;
    $.post('http://myserver/page', {content: snippet});
});

Проблема, с которой вы, скорее всего, столкнетесь, — это «такая же политика происхождения», которую многие браузеры применяют для JavaScript. Так что, если ваш JavaScript был загружен из http://myserver, как в этом примере, все будет в порядке.

Возможно, вы можете пойти другим путем — использовать язык сценариев, такой как Ruby, Python или (если у вас действительно хватит терпения) VBA. Сценарий может автоматизировать список страниц для очистки и целевое расположение информации. Он может так же легко упаковать его как запрос к новому серверу, если именно так обновляются страницы. Таким образом, вам не нужно беспокоиться о внедрении JavaScript и надеяться, что все работает без проблем.

person Berin Loritsch    schedule 17.12.2010
comment
Или, может быть, просто использовать директиву URL javascript: в заголовке? то есть javascript:alert("hello"); - person Qix - MONICA WAS MISTREATED; 18.12.2010

Я думаю, вам нужна Grease Monkey http://www.greasespot.net/

person MK.    schedule 17.12.2010
comment
Я согласен, сценарий жирной обезьяны обойдёт проблемы того же происхождения. Просто загрузите веб-сайт в Firefox и запустите скрипт, который очищает HTML. Однако парсинг HTML может быть очень сложным. - person Juan Mendes; 18.12.2010