С появлением LLM, в сгенерированных текстах стали всплывать слова, которые обычно не используются людьми.
Вот список таких слов, их регулярно используют LLM типа ChatGPT, Mistral и др.:
- Delve
- Harnessing
- At the heart of
- In essence
- Facilitating
- Intrinsic
- Integral
- Core
- Facet
- Nuance
- Culmination
- Manifestation
- Inherent
- Confluence
- Underlying
- Intricacies
- Epitomize
- Embodiment
- Iteration
- Synthesize
- Amplify
- Impetus
- Catalyst
- Synergy
- Cohesive
- Paradigm
- Dynamics
- Implications
- Prerequisite
- Fusion
- Holistic
- Quintessential
- Cohesion
- Symbiosis
- Integration
- Encompass
- Unveil
- Unravel
- Emanate
- Illuminate
- Reverberate
- Augment
- Infuse
- Extrapolate
- Embody
- Unify
- Inflection
- Instigate
- Embark
- Envisage
- Elucidate
- Substantiate
- Resonate
- Catalyze
- Resilience
- Evoke
- Pinnacle
- Evolve
- Digital Bazaar
- Tapestry
- Leverage
- Centerpiece
- Subtlety
- Immanent
- Exemplify
- Blend
- Comprehensive
- Archetypal
- Unity
- Harmony
- Conceptualize
- Reinforce
- Mosaic
- Catering
https://github.com/FareedKhan-dev/Detect-AI-text-Easily/blob/main/ai_words.txt
На основе этого списка было разработано веб приложение, которое подсветит эти слова в ваших текстах:
https://ai-text-detect-easy.streamlit.app/