13395178397
81%

Ran 18 Feb 2025 04:27PM UTC

Jobs 1

Files 62

Run time 1min

Badge

Embed ▾

Committed 18 Feb 2025 04:17PM UTC coverage: 81.07% (-0.002%) from 81.072%

Build # 13395178397

Build Type

push

github

Committed by

web-flow

Commit Message

add ragbench faithfulness cards (#1598)

* allow multi reference in hhem metric
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* add ragbench faithfulness cards
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* add "mistral-large-instruct" to provider
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* add "mistral-large-instruct" classification engines
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* add rag judges that use mistral-large-instruct
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* fix hhem multi reference
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* Revert "fix hhem multi reference"

This reverts commit 0abc51808.

* fix hhem multi reference
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* catch openai.BadRequestError in inference
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* fix answer correctness template
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* remove code added by error
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* bugfix in llm_as_judge_from_template
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* add comment
Signed-off-by: lilacheden <lilach.edel@gmail.com>

* fix typo
Signed-off-by: lilacheden <lilach.edel@gmail.com>

---------

Co-authored-by: elronbandel <elronbandel@gmail.com>

Coverage Stats

1498 of 1841 branches covered (81.37%)

Branch coverage included in aggregate %.

9500 of 11725 relevant lines covered (81.02%)

0.81 hits per line

Coverage Regressions

Lines	Coverage	∆	File
148	75.02	-0.01%	unitxt/metrics.py

Jobs

ID	Job ID	Ran	Files	Coverage
1	13395178397.1	18 Feb 2025 04:27PM UTC	62	81.07	GitHub Action Run

IBM / unitxt / 13395178397
81%

README BADGES
x

Markdown

Textile

RDoc

HTML

Rst

Coverage Regressions

Jobs

Source Files on build 13395178397

IBM / unitxt / 13395178397 81%

README BADGES x

Markdown

Textile

RDoc

HTML

Rst

Coverage Regressions

Jobs

Source Files on build 13395178397

IBM / unitxt / 13395178397
81%

README BADGES
x