Ефим, на начальном этапе высказывать предложения по функционалу, который может быть полезен/интересен.
Затем подождать реализации ядра, и уже потом зарегистрироваться в системе и участвовать в наполнении базы.
Как я это вижу: администратор создаёт сущности (базовые понятия), отношения (класс-экземпляр, например, сущность автобус - экземпляр сущности транспортного средства) и доступные атрибуты (для сущности человек это {рост, вес, дата рождения, дата смерти, образование, увлечения, психологический портрет и т.д.}.
Далее модераторы системы могут начинать оцифровку документов. Фраза "Поезд №X с 10-ю веселыми туристами прибыл в Серов вечером" должна быть сформулирована в терминах сущностей и атрибутов (поезд №X, содержать,туристы[количество=10, настроение=веселое], населённый пункт Серов, прибывать, в, вечернее время,дата=aa.bb.yyyy,часовой пояс=zz,источник=tt,уверенность=высокая).
Я понимаю, что это адова работа, но не вижу другого способа занести информацию структурированно. Возможно, получится использовать NLP для упрощения работы, тогда модератору понадобится ввести текст Свидетельства, и программа сама постарается выделить основные сущности и значения атрибутов, и за ней надо будет лишь тщательно проверить.
Есть много сложных моментов, надо как-то будет обрабатывать неопределенность во времени и пространстве, в уверенности свидетеля, сделать кросс-проверку расшифровок.
Зато, если это получится сделать, системе можно будет задавать сложные вопросы, и моментально получать аргументированные ответы на основе всех материалов дела.
Не знаю, правда, надо ли это кому-то :-)
Аделаида, мы - это любой зарегистрированный пользователь, который не помнит точно, в каком именно Свидетельстве проскакивал определенный факт или вещь, и хочет это быстро найти.
Или, к примеру, хочет проверить, мог ли манси Степан Куриков успеть побывать в точке B, зная моменты, когда он был в точках A и C (и их координаты).
И прочие подобные вещи.