-
Notifications
You must be signed in to change notification settings - Fork 49
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Générateur de rapport texte grâce a un LLM #602
Comments
Je ne comprends pas bien ce que c'est et à quoi ça sert ? |
Faciliter la création automatisée de rapports personnalisés, en exploitant les données de l'atlas pour répondre aux besoins spécifiques des différents persona (scientifiques, gestionnaires, collectivités, citoyen etc.). Cas d’utilisation potentiels : |
Hello. Au-delà de l'aspect fonctionnel sur lequel je n'ai pas d'opinion (il y a surement des cas d'usages très intéressant), j'alerte sur la partie technique. Aspect logiciel libre Ajouter du LLM dans GeoNature c'est ajouter une dépendance supplémentaire à un service pas si anodin. Il y a finalement assez peu de vrais modèles Open Source et libres qui sont performants aujourd'hui. Je pense qu'il y a un point de vigilance à avoir sur le modèle qui souhaite être utilisé. Typiquement il ne faudra pas utiliser des modèles chatGPT, Llama, Gemini et autres qui sont des boites noires (malgré le fait que certains se prétendent open source). Donc il faudra soit entraîner son propre modèle à partir de données via des outils type TensorFlow, soit utiliser des modèles déjà entraînés mais libres et qui semblent générer des réponses cohérentes. Aspect ressource Ensuite ça lève la question des ressources : si l'enjeu est de faire tourner ça sur les serveurs de chaque organisations qui héberge sont GeoNature ça peut faire évoluer les pré-requis techniques d'installation car certains LLM sont gourmands en ressource. Sinon pour éviter ça l'autre option est d'utiliser des API pour exploiter des modèles en ligne, mais là ça me semble encore plus compliqué pour du libre. |
OK, je vois pas encore bien les tenants et aboutissants. Dans tous les cas, en effet, il ne faut certainement pas ajouter ça d'office dans le cœur de GeoNature ou de GeoNature-atlas pour ne pas l'alourdir en terme de dépendance ni de ressource. |
Bonjour Je privilégier une solution cloud qui présente de nombreux avantages, notamment en termes d’impact environnemental, de mutualisation des ressources et de simplicité d’utilisation. Les centres de données des grands fournisseurs cloud sont conçus pour être énergétiquement efficaces. Les solutions cloud permettent des mises à jour automatiques, des évolutions rapides des fonctionnalités et une maintenance centralisée, éliminant ainsi la nécessité de compétences techniques pointues sur le terrain. Voici un petit comparatif par GPT des modèles open source adaptés à des générateurs de rapports : 1. GPT-NeoX/ChatGLM
2. LLaMA (Meta AI)
3. Bloom (BigScience)
4. Falcon (Technology Innovation Institute)
5. T5 (Google)
|
Ok, du coup ça impliquerai de devoir souscrire à un service tiers pour pouvoir bénéficier de la fonctionnalité ? Car j'ai l'impression que les modèles proposés ne sont pas disponibles en accès libre en ligne directement. Concernant les modèles listés :
Quelques ressources :
J'insiste là-dessus car les boites d'IA ont longtemps profité de zones floues sur la définition d'IA OS pour se prétendre OS (comme LLaMa par exemple). Sauf que fin 2024 un standard est enfin sorti, donc il faut en profiter pour utiliser des outils qui remplissent réellement ces critères. D'autant plus qu'il s'agit de "boites noires" et qu'il faut donc un niveau d'exigence particulièrement élevé pour in fine tenter de réduire au mieux les biais et dérives que les modèles peuvent apporter. |
Et qu'est ce que tu pense de Mistral ? Dans tous les cas faire appel a une API me parait bc plus frugal que d'instancier un modèle sur une infra locale. Cette option peut être laisser libre au choix du mainteneur de l'instance en config. |
Oui je suis d'accord.
Le modèle Mixtral de Mistral ne rempli pas les critère suffisants pour être qualifié d'IA Open Source. Après d'un point de vue usage je n'ai pas d'avis je n'ai pas eu l'occasion de le tester pour le moment. Quelques modèles de générateur de textes qui sont considéré comme remplissant les critères de transparence suffisants pour être des IA Open Sources selon les critères de l'OSI :
|
Bonjour à tous,
Nous avons entamé une réflexion autour de la génération de rapports pour différents clients en utilisant une approche Retrieval-Augmented Generation (RAG) à partir des données d'un atlas. Pour ceux qui souhaitent en savoir plus sur le concept RAG, voici un lien utile :
Retrieval-Augmented Generation (RAG) et recherche sémantique pour les GPTs.
L'idée est de poser les bases pour engager une discussion collective :
Quels modèles LLMs (Large Language Models) envisager pour ce type d'usage ?
Quels cas d'utilisation pourraient être couverts ?
Quels exemples de rapports spécifiques à GeoNature ou aux atlas de biodiversité pourrait-on imaginer ?
Vos retours et idées sont les bienvenus pour structurer ce sujet.
Merci à tous !
The text was updated successfully, but these errors were encountered: