вот пример того, про что я писал - попытка использовать GitHub
сделал последовательно выборку запросом freeExec в базах за разные даты
https://github.com/Xmypblu/example-csv-fgis/commits/master.atom
в отличии от BitBucket - в ленте не показывается название папки и файла
https://yadi.sk/i/R9KA0yO6j8JZo
если freeExec покажет как изменить запрос, чтобы в базе дополнительно создавались 2 таблицы:
- по номеру субъекта (например Ульяновская область - 21944) в базе создавалась таблица с названием doc_21944 (или doc_RU-ULY). Куда скопировать все строки документов из таблицы document_list_report относящиеся к Ульяновской области.
- В таблицу с названием files_21944, скопировать все строки из таблицы documentfileinfoes, относящиеся к Ульяновской области
позже смогу написать скрипт для экспорта в CSV и отправки на GitHub - посмотреть, как это выглядит и насколько это будет удобно…
дальше… зачем нужна SQLite база - она нужна мне, для эксперементов с Django.
Делал для себя, но готов поделится.
Зимой экспериментировал с python-social-auth и django-tables2
Скриншоты прототипа работающего на SQLite, что я выложил
чекбоксы - как раз для “стола заказов”, но пока не реализовал обработку
Идея была такая: выбираем, подсчет объема и прикидывается время (ограничения еще не продуманы), создается список документов/файлов, по крону скачивается (порциями) и размещается в хранилище.
Там еще есть засада с длиной и спецсимволами в названии папок и файлов - посчитайте самые длинные.
У меня получилось найти 839 у папки и 472 символа у файла.
Есть мысли сохранять названия в базе, а файлы и папки именовать по их UUID…
Если #daf готов поделится аккаунтом с Тб - мои контакты в профиле, буду экспериментировать с майлрушным облаком (и ждать когда они родят WebDAV)
Про Magnet и Metalink - сказать нечего, не сталкивался, но при случае надо будет разобраться…
не уверен что понял, но идея вставить в валидаторы ссылки на список файлов(или хранилища) интересна, но это скорее к держателям валидаторов вопрос.
И думаю, что это произойдет быстрее, если сделать API - если я правильно понимаю задачу.