Essays about: "Josef Khedri"

Found 1 essay containing the words Josef Khedri.

  1. 1. Comparison Between RLHF and RLAIF in Fine-Tuning a Large Language Model

    University essay from KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Author : Samuel Höglund; Josef Khedri; [2023]
    Keywords : ;

    Abstract : Denna artikel undersöker fördelarna, nackdelarna och skillnaderna mellan förstärkningsinlärning från mänsklig återkoppling (RLHF) och förstärkningsinlärning från AI-återkoppling (RLAIF) i kontexten av finjustering av en stor språkmodell. RLHF har vanligtvis använts för att anpassa språkmodeller efter mänskliga preferenser genom att inkludera mänsklig feedback, medan RLAIF föreslår att man använder en AI-baserad metod för att ersätta mänsklig återkoppling. READ MORE