Aрхив софта для ретрокомпьютеров

Поиск, обмен ссылками, вопросы по устаревшему программному обеспечению.
SuperMax
Advanced Member
Сообщения: 1606
Зарегистрирован: 27.08.2012,11:38
Откуда: Красноярск
Контактная информация:

Конкурсы

Вклад в сообщество

Aрхив софта для ретрокомпьютеров

Сообщение SuperMax » 25.08.2016,04:19

новости

В архив софта для ретрокомпьютеров прикрутил систему поиска


сейчас на 2024-03-06 в поиске 20`035`626 файлов
объем индексированного 36`090`701 MB

примеры Тетрис для VAX
OpenVMS для Alpha
Драйвера для ET6000
Ищем все про ДВК в архиве Пересторонина


по умолчанию поиск идет по всем словам

если надо что-то исключить перед словом вставьте ~ (пробел не надо)
Ищем voodoo исключив из поиска nt4

если слово не полностью то пишите так
Ищем все в начале которого voodoo


чего [пока] нет
-морфологии
-транслитерации
-контекстного поиска по содержимому файлов
-контекстного поиска по содержимому архивов
будет ли это делаться зависит от востребованности функционала

советы, замечания приветствуются

сразу скажу, что это сделано по-быстрому, за минувшие выходные и это просто пробный шар в поисковой системе
Последний раз редактировалось SuperMax 06.03.2024,12:33, всего редактировалось 4 раза.

Аватара пользователя
DOS Logic
Advanced Member
Сообщения: 5849
Зарегистрирован: 01.07.2006,13:32
Откуда: Украина. Ивано-Франковск
Контактная информация:

Вклад в сообщество

Сообщение DOS Logic » 25.08.2016,08:49

круто :thumbup:

Гость

Сообщение Гость » 25.08.2016,11:00

SuperMax, странно: пишет "Search: "amstrad" found 2419 results" а на экране не более сотни ссылок.
Что называется результатом и как оно подсчитано?

Да, и в выдаче полно "неопределимых" файлов, таких как "index.htm" коий к теме поиска отношения не имеет. Это просто левая страница, в облаке тегов которой (даже не в самом теле!) упомянуто поисковое слово.

Было-бы здорово организовать именно БД, по одной на каждый тип оборудования (атари, амига, вакс, и т.п.), где были-бы перечислены ссылки на реальные файлы софта. С подробным описанием. Затем, на основе БД составить каталог (FTP) и сложить в него всё выкачанное по ссылкам, получится бекап.

Разумеется, в-одиночку "архивировать инет" ты не сможешь, значит для каждой БД назначить нескольких модераторов-архивариусов из числа заинтересованных соответствующей техникой.

PS. Почему речь об БД и жёстком "раскладывании по полочкам"? Так ведь софт уже написан и нового не предвидится. (А ежли-вдруг, так добавить один-два пункта зело проще!)

PPS. За попытку "консолидации" собора разрозненной инфы - большой плюс!

SuperMax
Advanced Member
Сообщения: 1606
Зарегистрирован: 27.08.2012,11:38
Откуда: Красноярск
Контактная информация:

Конкурсы

Вклад в сообщество

Сообщение SuperMax » 25.08.2016,12:24

отвечу по пунктам
1. на экран выводится первые 99 результатов по убыванию релевантности
скоро прикручу листалку как на гугле, просто руки не дошли.
[если тут есть крутой дизайнер, который готов выдрать куски оформления с гугла или дадака - велкам в личку, помощь будет в тему]

2. касаемо index.htm и прочих - поясняю, индексация идет по имени файла и пути к нему
тк на сервере куча зеркал различных живых и уже мертвых сайтов и ftp-шников
начиная от хюлетовского ftp - кончая подборками технической литературы

технически поиск можно усложнить добавить типы файлов (те при сканировании файлов в базу положены mime types всех файлов)

3. это поисковик по моему архиву http://mirrors.pdp-11.ru/ и только, т.е. задачи индексировать весь инет нет и не будет, тк сегодня сайт есть, а завтра уже нет.
соответственно методика наполнения простая - нашел интересное, закачал, по возможности классифицировал в нужную директорию
и сейчас к этому добавилась фишка индексирования.

Однако, если есть желание помогать, то это очень хорошо, тк множество сайтов надо разобрать и разложить
http://mirrors.pdp-11.ru/_misc/ftp.sunet.se/pub/os/
явно надо раскидать по операционкам

На счет БД и описания - можно сделать интерфейс к БД и дать доступ по типу вики
для прикрепления описаний к директориям или файлам. Можно начать с малого - редактирование тегов.

4. это не попытка, это уже самый большой архив из существующих :cool:

upd: немного дополнил архив - сейчас в нем
6'006'399 файлов 4'498 ГБ


SokilOff
Member
Сообщения: 196
Зарегистрирован: 30.12.2012,23:41

Сообщение SokilOff » 30.08.2016,21:18

SuperMax писал(а): это не попытка, это уже самый большой архив из существующих
Самый большой из существующих - это archive.org
Но всё равно круто =)

SuperMax
Advanced Member
Сообщения: 1606
Зарегистрирован: 27.08.2012,11:38
Откуда: Красноярск
Контактная информация:

Конкурсы

Вклад в сообщество

Сообщение SuperMax » 02.09.2016,12:40

SokilOff писал(а):Самый большой из существующих - это archive.org
web.archive.org безусловно очень серьезный проект, но у них совсем другое направление и другая задача - это не сколько сохранение информации (попробуйте провалится в глубину сайта в архиве - как правило пусто) сколько сохранение внешнего вида сайтов.

я же ставлю задачу сохранения информации целиком, без ориентировки на сохранение оформления.
те по сути близкие по духу проекты это http://bitsavers.informatik.uni-stuttgart.de/ , DECUS итд итп
причем последний, вообще не индексируется поисковиками тк их дурные антивирусные системы находят там опасные вирусы (!)

SokilOff
Member
Сообщения: 196
Зарегистрирован: 30.12.2012,23:41

Сообщение SokilOff » 03.09.2016,00:24

SuperMax писал(а):web.archive.org безусловно очень серьезный проект, но у них совсем другое направление и другая задача - это не сколько сохранение информации (попробуйте провалится в глубину сайта в архиве - как правило пусто) сколько сохранение внешнего вида сайтов
archive.org - это намного больше, чем просто web.archive.org

В тамошних разделах shareware CD-ROMs и Community Software вагон и маленькая тележка ретро- и современного вареза. И как раз ретро - наша тема.

SuperMax
Advanced Member
Сообщения: 1606
Зарегистрирован: 27.08.2012,11:38
Откуда: Красноярск
Контактная информация:

Конкурсы

Вклад в сообщество

Сообщение SuperMax » 03.09.2016,10:24

SokilOff писал(а):archive.org - это намного больше, чем просто web.archive.org
В тамошних разделах shareware CD-ROMs и Community Software вагон и маленькая тележка ретро- и современного вареза. И как раз ретро - наша тема.
согласен, там много чего есть. но вот по моим основным направлениям - DEC: VAX PDP-11 итд очень мало

вообще я хочу перевести разговор в другое русло - есть ли что интересное, что стоит добавить в мой архив ?



Аватара пользователя
Takedasun
Advanced Member
Сообщения: 3640
Зарегистрирован: 16.10.2013,18:07
Откуда: Керчь

Вклад в сообщество

Сообщение Takedasun » 04.09.2016,00:35

Интересный сайт. Спасибо!!! :thumbup:

SuperMax
Advanced Member
Сообщения: 1606
Зарегистрирован: 27.08.2012,11:38
Откуда: Красноярск
Контактная информация:

Конкурсы

Вклад в сообщество

Сообщение SuperMax » 08.09.2016,11:23

небольшой апдейт

1. прикрутил разбивку на страницы - теперь можно просмотреть все результаты поиска
2. поработал над оформлением - теперь в результатах поиска иконки типов файлов отображаются также как и в простом просмотре
3. в результатах поиска можно сразу перейти на директорию с найденным файлом - для удобства просмотра "а что еще есть?"

SuperMax
Advanced Member
Сообщения: 1606
Зарегистрирован: 27.08.2012,11:38
Откуда: Красноярск
Контактная информация:

Конкурсы

Вклад в сообщество

Сообщение SuperMax » 30.09.2016,11:04

апдейт по данным

1. почищен мусор
2. много новинок - сейчас в архиве 5774GB

вопрос с добровольными помощниками открытый - те есть много софта PC-направления на разбор и сортировку

Ответить