обучить корпоративной схеме данных (700+ таблиц и 6000+ колонок) в формате: "имя" + "описание назначения"
дать пользователям возможность задавать вопросы по структуре данных и в ответах давать ссылки на имена колонок и таблиц.

Возможно ли работать с таким объемом частных (корпоративных) данных с описанным вами подходом?

Mark_K May 1 2023 at 23:00

Тут лучше говорить не про обучаемые данные, а про входные данные. Т.е вы на вход даете описания ваших данных, а на выходе ждете, что ИИ поймет их структуру и связи. В принципе это реально, вопрос в методологии - как сохранять промежуточные состояния, чтобы использовать их как долговременную память

vagon333 May 2 2023 at 08:05

Не получится скормить а запросе сотни мб данных.

В моем случае ИИ нужен для:

анализа вопроса в терминах индустрии (законы);
трансляция вопроса в формулу на основе структуры данных.

Пример запроса: In a manual underwrite where there is a short sale within the last 3 years, evidence an exception granted and supporting documentation was not in the file.
— HUD Handbook 4000.1: II.A.5.a.iii(J)

Т.е. без схемы ответить на вопрос нельзя.

Yuriks111 Jul 29 2023 at 20:34

ИМХО LangChain задает хороший фреймворк подхода к работе с LLM, но реализация часто сложнее и менее прозрачна чем если напрямую с тем же API OpenAI.

Show the best of all time