A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Model | Args | Tasks | Version | Filter | num_fewshot | Metric | Value | Stderr | |||||||||||||||||
2 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mme | Yaml | none | 0 | mme_cognition_score | 316.7857143 | N/A | |||||||||||||||||
3 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mme | Yaml | none | 0 | mme_percetion_score | 1575.078431 | N/A | |||||||||||||||||
4 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ferret | Yaml | none | 0 | gpt_eval_ferret_refer_desc | 81.7 | N/A | |||||||||||||||||
5 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ferret | Yaml | none | 0 | gpt_eval_ferret_refer_reason | 86.2 | N/A | |||||||||||||||||
6 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ferret | Yaml | none | 0 | gpt_eval_ferret_ground_conv | 29.6 | N/A | |||||||||||||||||
7 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ferret | Yaml | none | 0 | gpt_eval_ferret_all | 61 | N/A | |||||||||||||||||
8 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | hallusion_bench_image | Yaml | none | 0 | aAcc | 44.4795 | N/A | |||||||||||||||||
9 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | hallusion_bench_image | Yaml | none | 0 | fAcc | 18.4971 | N/A | |||||||||||||||||
10 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | hallusion_bench_image | Yaml | none | 0 | qAcc | 15.1648 | N/A | |||||||||||||||||
11 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_bench_coco | Yaml | none | 0 | gpt_eval_llava_conv | 104.8 | N/A | |||||||||||||||||
12 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_bench_coco | Yaml | none | 0 | gpt_eval_llava_detail | 95.1 | N/A | |||||||||||||||||
13 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_bench_coco | Yaml | none | 0 | gpt_eval_llava_complex | 110.2 | N/A | |||||||||||||||||
14 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_bench_coco | Yaml | none | 0 | gpt_eval_llava_all | 104 | N/A | |||||||||||||||||
15 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_in_the_wild | Yaml | none | 0 | gpt_eval_llava_conv | 68.8 | N/A | |||||||||||||||||
16 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_in_the_wild | Yaml | none | 0 | gpt_eval_llava_detail | 60.4 | N/A | |||||||||||||||||
17 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_in_the_wild | Yaml | none | 0 | gpt_eval_llava_complex | 81.3 | N/A | |||||||||||||||||
18 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | llava_in_the_wild | Yaml | none | 0 | gpt_eval_llava_all | 72.3 | N/A | |||||||||||||||||
19 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mathvista_testmini | Yaml | none | 0 | gpt_eval_score | 35.1 | N/A | |||||||||||||||||
20 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmvet | Yaml | none | 0 | gpt_eval_score | 49.12844037 | N/A | |||||||||||||||||
21 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ai2d | Yaml | none | 0 | exact_match | 0.7004533679 | 0.0082 | |||||||||||||||||
22 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | chartqa | Yaml | none | 0 | relaxed_overall | 0.622 | 0.0097 | |||||||||||||||||
23 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | chartqa | Yaml | none | 0 | relaxed_human_split | 0.52 | 0.0141 | |||||||||||||||||
24 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | chartqa | Yaml | none | 0 | relaxed_augmented_split | 0.724 | 0.0126 | |||||||||||||||||
25 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | cmmmu_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
26 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | cmmmu_val | Yaml | none | 0 | cmmmu_acc | 0.231 | N/A | |||||||||||||||||
27 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_test | Yaml | none | 0 | coco_passthrough | None | N/A | |||||||||||||||||
28 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_Bleu_4 | 0.273564876 | N/A | |||||||||||||||||
29 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_Bleu_3 | 0.3680006341 | N/A | |||||||||||||||||
30 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_Bleu_2 | 0.4856597982 | N/A | |||||||||||||||||
31 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_Bleu_1 | 0.6204331937 | N/A | |||||||||||||||||
32 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_METEOR | 0.2468630393 | N/A | |||||||||||||||||
33 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_ROUGE_L | 0.52063644 | N/A | |||||||||||||||||
34 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2014_cap_val | Yaml | none | 0 | coco_CIDEr | 0.9945813763 | N/A | |||||||||||||||||
35 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_test | Yaml | none | 0 | coco_passthrough | None | N/A | |||||||||||||||||
36 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_Bleu_4 | 0.2759787348 | N/A | |||||||||||||||||
37 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_Bleu_3 | 0.370133874 | N/A | |||||||||||||||||
38 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_Bleu_2 | 0.4879635421 | N/A | |||||||||||||||||
39 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_Bleu_1 | 0.6229811163 | N/A | |||||||||||||||||
40 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_METEOR | 0.2469936433 | N/A | |||||||||||||||||
41 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_ROUGE_L | 0.5219757709 | N/A | |||||||||||||||||
42 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | coco2017_cap_val | Yaml | none | 0 | coco_CIDEr | 1.019917323 | N/A | |||||||||||||||||
43 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | docvqa_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
44 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | docvqa_val | Yaml | none | 0 | anls | 0.7745372967 | 0.0057 | |||||||||||||||||
45 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_Bleu_4 | 0.2429938895 | N/A | |||||||||||||||||
46 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_Bleu_3 | 0.3451980212 | N/A | |||||||||||||||||
47 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_Bleu_2 | 0.4834103487 | N/A | |||||||||||||||||
48 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_Bleu_1 | 0.6527737957 | N/A | |||||||||||||||||
49 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_METEOR | 0.2221385197 | N/A | |||||||||||||||||
50 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_ROUGE_L | 0.4879907691 | N/A | |||||||||||||||||
51 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | flickr30k_test | Yaml | none | 0 | flickr_CIDEr | 0.6670281687 | N/A | |||||||||||||||||
52 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | gqa | Yaml | none | 0 | exact_match | 0.6536810304 | 0.0042 | |||||||||||||||||
53 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | iconqa_test | Yaml | none | 0 | anls | 0 | 0 | |||||||||||||||||
54 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | iconqa_val | Yaml | none | 0 | anls | 0 | 0 | |||||||||||||||||
55 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | infovqa_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
56 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | infovqa_val | Yaml | none | 0 | anls | 0.4134237772 | 0.0093 | |||||||||||||||||
57 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmbench_cn_cc | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
58 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmbench_cn_dev | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
59 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmbench_cn_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
60 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmbench_en_dev | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
61 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmbench_en_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
62 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmmu_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
63 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | mmmu_val | Yaml | none | 0 | mmmu_acc | 0.359 | N/A | |||||||||||||||||
64 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | multidocvqa_test | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
65 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | multidocvqa_val | Yaml | none | 0 | anls | 0.4628493755 | N/A | |||||||||||||||||
66 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | multidocvqa_val | Yaml | none | 0 | accuracy | 0.3256217467 | N/A | |||||||||||||||||
67 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_test | Yaml | none | 0 | nocaps_passthrough | None | N/A | |||||||||||||||||
68 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_Bleu_4 | 0.3408165348 | N/A | |||||||||||||||||
69 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_Bleu_3 | 0.448930148 | N/A | |||||||||||||||||
70 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_Bleu_2 | 0.5697307224 | N/A | |||||||||||||||||
71 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_Bleu_1 | 0.6882759066 | N/A | |||||||||||||||||
72 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_METEOR | 0.2545470708 | N/A | |||||||||||||||||
73 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_ROUGE_L | 0.5495927073 | N/A | |||||||||||||||||
74 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | nocaps_val | Yaml | none | 0 | nocaps_CIDEr | 0.8827397344 | N/A | |||||||||||||||||
75 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ok_vqa_val2014 | Yaml | none | 0 | exact_match | 0.4627427688 | 0.0067 | |||||||||||||||||
76 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | ok_vqa_val2014 | Yaml | none | 0 | submission | None | N/A | |||||||||||||||||
77 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | pope | Yaml | none | 0 | pope_accuracy | 0.8755555556 | N/A | |||||||||||||||||
78 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | pope | Yaml | none | 0 | pope_precision | 0.9622538293 | N/A | |||||||||||||||||
79 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | pope | Yaml | none | 0 | pope_recall | 0.7817777778 | N/A | |||||||||||||||||
80 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | pope | Yaml | none | 0 | pope_f1_score | 0.8626777832 | N/A | |||||||||||||||||
81 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | pope | Yaml | none | 0 | pope_yes_ratio | 0.5 | N/A | |||||||||||||||||
82 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_Bleu_4 | 0.01258775423 | N/A | |||||||||||||||||
83 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_Bleu_3 | 0.03338466898 | N/A | |||||||||||||||||
84 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_Bleu_2 | 0.08537554928 | N/A | |||||||||||||||||
85 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_Bleu_1 | 0.2103332802 | N/A | |||||||||||||||||
86 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_METEOR | 0.1197516506 | N/A | |||||||||||||||||
87 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_ROUGE_L | 0.2348103338 | N/A | |||||||||||||||||
88 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_test | Yaml | none | 0 | refcoco_CIDEr | 0.3820971053 | N/A | |||||||||||||||||
89 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_Bleu_4 | 0.009402202482 | N/A | |||||||||||||||||
90 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_Bleu_3 | 0.02090769752 | N/A | |||||||||||||||||
91 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_Bleu_2 | 0.0634764959 | N/A | |||||||||||||||||
92 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_Bleu_1 | 0.1687967433 | N/A | |||||||||||||||||
93 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_METEOR | 0.1082196216 | N/A | |||||||||||||||||
94 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_ROUGE_L | 0.191434539 | N/A | |||||||||||||||||
95 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testA | Yaml | none | 0 | refcoco_CIDEr | 0.1863022361 | N/A | |||||||||||||||||
96 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testB | Yaml | none | 0 | refcoco_Bleu_4 | 2.31E-06 | N/A | |||||||||||||||||
97 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testB | Yaml | none | 0 | refcoco_Bleu_3 | 0.04319324992 | N/A | |||||||||||||||||
98 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testB | Yaml | none | 0 | refcoco_Bleu_2 | 0.1046754624 | N/A | |||||||||||||||||
99 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testB | Yaml | none | 0 | refcoco_Bleu_1 | 0.2508942889 | N/A | |||||||||||||||||
100 | llava | pretrained=liuhaotian/llava-v1.6-vicuna-13b | refcoco_bbox_testB | Yaml | none | 0 | refcoco_METEOR | 0.1259812211 | N/A |