[Sarlug] Выкачивание библиотек SharePoint

Taras Perebeynosov taras.perebeynosov на gmail.com
Вс Янв 18 20:40:19 MSK 2015


Подмонтируйте библиотеку по WebDAV и работайте как с обычной директорией

пт, 16 янв. 2015, 18:25, NIR <faust на gmx.com>:

>  К сожалению, wget и прочие не переваривают JavaScript, который грузит
> списки файлов по 30 штук на страницу, а также начнёт качать много того, что
> абсолютно не нужно.
>
> Мне тут подсказали уточнить на счёт REST API и я таки имею информацию, что
> он доступен, но я не могу понять как и что слать SharePoint, чтобы он мне
> выдал листинг. У Tcl есть модуль ::rest::, но в документации о нём сказано
> примерно ничего.
>
> P. S.: А ещё у SharePoint есть SOAP и прочие плюшки, но, опять же, об этих
> технологиях я знаю только то, что они есть и у них есть ИКСЭМЭЛЬ.
>
> 16.01.2015 18:52, Dmitry Agafonov пишет:
>
> Если там обычные корректные url на файлы и подпапки, то классика жанра -
> wget.
> К ней есть веб морды, если лениво, и есть описания в т.ч. на русском.
>
> 16 января 2015 г., 15:55 пользователь NIR <faust на gmx.com> <faust на gmx.com> написал:
>
>
>   Всем привет.
>
> Столкнулся с задачей: выкачать из определённой библиотеки SharePoint все
> файлы. Файлов порядка 11000. Есть упрощающая задачу штука: список файлов
> (неполный). Желание автоматизировать и ускорить процесс родило костыль:
>
> Есть простой скрипт вида для загрузки одного файла:
> #!/bin/sh
> cd "/home/nir/Work/FLC/Actual/First run/Drawings/Siterip";
> curl -i --ntlm -k -O -G --sslv3 -A "Mozilla/5.0 (Windows; U; Windows NT
> 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.A.B.C
> Safari/525.13" --user "MyUsername:MyPassword""https://sharepoint.website.com/sites/blah/blah/Library/$1" <https://sharepoint.website.com/sites/blah/blah/Library/$1><https://sharepoint.website.com/sites/blah/blah/Library/$1> <https://sharepoint.website.com/sites/blah/blah/Library/$1>
>
> Есть скрипт на Tcl, который переваривает файл со списком выгружаемых
> документов и по одному их качает. Таким образом выгрузил порядка 4500
> документов из 11000.
>
> Проблемы:
> 1) curl гадит в начало файлов HTTP-заголовками, которые придётся подчищать
> ещё одним костылём.
> 2) Как выкачать все файлы из библиотеки, если я не знаю их названий? Ещё
> библиотеке есть подпапки, в которые было бы неплохо зайти и тоже всё
> выкачать.
>
> Заранее спасибо.
>
> --
> С уважением, Игорь Чудов
> Энгельсский Инструментальный Завод "ЭИЗ"
> Сайт: http://nir.org.ru/
> Телефон: +7 937 266-51-34
>
>
> _______________________________________________
> Sarlug mailing listSarlug на lists.lug.ruhttps://lists.lug.ru/mailman/listinfo/sarlug
>
>
>
>
>
> --
> С уважением, Игорь Чудов
> Энгельсский Инструментальный Завод "ЭИЗ"
> Сайт: http://nir.org.ru/
> Телефон: +7 937 266-51-34
>
>  _______________________________________________
> Sarlug mailing list
> Sarlug на lists.lug.ru
> https://lists.lug.ru/mailman/listinfo/sarlug
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.lug.ru/pipermail/sarlug/attachments/20150118/b1fd4e3d/attachment-0001.html>


Подробная информация о списке рассылки Sarlug