4All Avatar - Transforming Online Reading for Every Mind

Empowering individuals with ADHD by converting web content through a browser extension

 

Il 4All Avatar rappresenta una soluzione innovativa su misura per affrontare le sfide di accessibilità incontrate da individui come Emily, che si confrontano con ostacoli legati all'attenzione come l'ADHD. Questa innovativa estensione del browser è il frutto di un lavoro collaborativo del nostro dedicato team presso il Politecnico di Milano, sotto la guida dei Professori Maristella Matera, Diego Morra e Francesco Ermanno Guida.

Al suo nucleo, il 4All Avatar integra senza soluzione di continuità diversi componenti chiave per offrire un'esperienza di lettura online migliorata e accessibile. In primo luogo, sfruttando la tecnologia avanzata, il livello middleware in Python automatizza il processo di cattura del contenuto delle pagine web. Ciò garantisce che l'essenza del materiale venga catturata con precisione, preparando il terreno per ulteriori manipolazioni.

Una volta estratto il contenuto, il livello middleware in Python si occupa di formattare i dati e di inviarli al servizio ChatGPT. Qui, algoritmi sofisticati entrano in gioco, condensando e manipolando il contenuto per evidenziare i punti chiave all'interno dell'articolo. Questo processo di ottimizzazione assicura che le informazioni siano presentate in modo chiaro e facilmente comprensibile, affrontando il sovraccarico cognitivo sperimentato dagli utenti con disturbi neurosviluppo.

Inoltre, il 4All Avatar estende la sua funzionalità incorporando capacità di conversione video. Dopo la fase di manipolazione del contenuto, il testo condensato viene trasformato in formato video dinamico, offrendo un'alternativa visivamente coinvolgente ai formati tradizionali basati su testo. Questa trasformazione è particolarmente vantaggiosa per individui che hanno difficoltà con articoli lunghi, fornendo un mezzo più accessibile per consumare contenuti online.

Una caratteristica centrale del 4All Avatar è l'integrazione di un avatar animato. Questo personaggio animato funge da guida durante la presentazione video, narrando dinamicamente e illustrando visivamente il contenuto. Fornendo un elemento interattivo e coinvolgente, l'avatar migliora la comprensione e la memorizzazione, rispondendo alle diverse esigenze degli utenti.

Infine, il livello Interfaccia Utente svolge un ruolo fondamentale nell'interagire con gli utenti, ridisegnando senza soluzione di continuità il sito web e fornendo accesso all'avatar. Questo strato garantisce un'esperienza utente amichevole, facilitando la navigazione senza sforzo e l'interazione con i contenuti.

In sintesi, il 4All Avatar rappresenta una soluzione completa che affronta le barriere cognitive, di navigazione e informative incontrate da individui con disturbi neurosviluppo. Sfruttando il potere della tecnologia e dell'innovazione, il nostro team è dedicato a garantire un accesso equo per tutti, permettendo a individui come Emily di accedere e interagire con i contenuti online in modo più efficace e piacevole.

Dal punto di vista tecnico, il 4All Avatar opera attraverso un'integrazione senza soluzione di continuità di vari componenti per offrire un'esperienza di lettura online migliorata. Ecco come funziona:

  1. Estrazione del Contenuto: Il processo inizia con il livello middleware in Python che cattura automaticamente il contenuto delle pagine web. Ciò viene ottenuto attraverso tecniche di web scraping, che estraggono il testo e altri dati rilevanti da articoli online, blog o contenuti web.
  2. Manipolazione del Contenuto: Una volta estratto il contenuto, il livello middleware in Python formatta i dati e li invia al servizio ChatGPT. Utilizzando algoritmi sofisticati, questo servizio condensa e manipola il contenuto per evidenziare i punti chiave all'interno dell'articolo. Identifica le informazioni più significative e ottimizza il contenuto per concentrarsi su idee e approfondimenti essenziali.
  3. Conversione in Video: Dopo la fase di manipolazione del contenuto, il livello middleware in Python invia la trascrizione del testo delle notizie a Azure Speech Studio. Qui, il testo viene convertito in un video avatar utilizzando la tecnologia di sintesi vocale. Questa trasformazione consente la presentazione del materiale in modo dinamico e visivamente coinvolgente, fornendo un formato alternativo per gli utenti che hanno difficoltà con il contenuto basato su testo tradizionale.
  4. Integrazione Avatar: Una caratteristica centrale dell'estensione è l'inclusione di un avatar animato. Il livello middleware in Python rende il video avatar originale elaborato e lo fornisce allo strato superiore. Questo personaggio animato funge da guida durante la presentazione video, narrando dinamicamente e illustrando visivamente il contenuto. L'avatar aggiunge un livello di interattività e coinvolgimento, migliorando la comprensione e la memorizzazione.
  5. Interazione con l'Interfaccia Utente: Infine, lo strato Interfaccia Utente interagisce con gli utenti, ridisegnando il sito web per incorporare l'avatar e fornire accesso ai contenuti migliorati. Questo strato garantisce un'esperienza senza soluzione di continuità e user-friendly, facilitando la navigazione senza sforzo e l'interazione con i contenuti.

The 4All Avatar represents a pioneering solution tailored to address the accessibility challenges faced by individuals like Emily, who contend with attention-related hurdles such as ADHD. This innovative browser extension is the culmination of a collaborative effort by our dedicated team at Politecnico di Milano, under the leadership of Professors Maristella Matera, Diego Morra, and Francesco Ermanno Guida.

At its core, the 4All Avatar seamlessly integrates several key components to deliver an enhanced and accessible online reading experience. Firstly, leveraging advanced technology, the Python middleware layer automates the process of capturing webpage content. This ensures that the essence of the material is captured accurately, setting the stage for further manipulation.

Once the content is extracted, the Python middleware layer takes charge of formatting the data and sending it to the ChatGPT service. Here, sophisticated algorithms come into play, condensing and manipulating the content to highlight key points within the article. This streamlining process ensures that the information is presented in a concise and easily digestible format, addressing cognitive overload experienced by users with neurodevelopmental disorders.

Furthermore, the 4All Avatar extends its functionality by incorporating video conversion capabilities. After the content manipulation phase, the condensed text is transformed into dynamic video format, offering a visually engaging alternative to traditional text-based formats. This transformation is particularly beneficial for individuals who struggle with lengthy articles, providing a more accessible means of consuming online content.

A central feature of the 4All Avatar is the integration of an animated avatar. This animated character serves as a guide throughout the video presentation, dynamically narrating and visually illustrating the content. By providing an interactive and engaging element, the avatar enhances comprehension and retention, catering to the diverse needs of users.

Lastly, the User Interface layer plays a pivotal role in interacting with users, seamlessly re-rendering the website and providing access to the avatar. This layer ensures a user-friendly experience, facilitating effortless navigation and engagement with the content.

In summary, the 4All Avatar represents a comprehensive solution that addresses the cognitive, navigational, and informational barriers encountered by individuals with neurodevelopmental disorders. By harnessing the power of technology and innovation, our team is dedicated to ensuring equal access for all, empowering individuals like Emily to access and engage with online content more effectively and enjoyably.

From a technical perspective, the 4All Avatar operates through a seamless integration of various components to deliver an enhanced online reading experience. Here's a breakdown of how it works:

  1. Content Extraction: The process begins with the Python middleware layer automatically capturing webpage content. This is achieved through web scraping techniques, which extract the text and other relevant data from online articles, blogs, or web content.
  2. Content Manipulation: Once the content is extracted, the Python middleware layer formats the data and sends it to the ChatGPT service. Using sophisticated algorithms, this service condenses and manipulates the content to highlight key points within the article. It identifies the most significant information and streamlines the content to focus on essential ideas and insights.
  3. Video Conversion: After the content manipulation phase, the Python middleware layer sends the transcribed news transcript to Azure Speech Studio. Here, the text is converted into an avatar video using speech synthesis technology. This transformation enables the presentation of the material in a dynamic and visually engaging manner, providing an alternative format for users who struggle with traditional text-based content.
  4. Avatar Integration: A central feature of the extension is the inclusion of an animated avatar. The Python middleware layer renders the processed original avatar video and provides it to the upper layer. This animated character serves as a guide throughout the video presentation, dynamically narrating and visually illustrating the content. The avatar adds a layer of interactivity and engagement, enhancing comprehension and retention.
  5. User Interface Interaction: Finally, the User Interface layer interacts with users, re-rendering the website to incorporate the avatar and providing access to the enhanced content. This layer ensures a seamless and user-friendly experience, facilitating effortless navigation and engagement with the content.

Presentation link

 

Repo: https://github.com/haotian1028/IDT_NewsAvatar

Video: https://drive.google.com/file/d/1xOI9Xtnbzy1d6ffKE6_3cX3aoXAmyUf2/view?usp=sharing