Pulse · modelscope/ms-swift

August 20, 2024 – September 20, 2024

133 Active pull requests

363 Active issues

v2.3.2
published Aug 24, 2024
v2.4.0
published Sep 13, 2024
v2.4.1
published Sep 13, 2024
v2.4.2
published Sep 18, 2024

fix qwen2.5 template
#2081 merged Sep 20, 2024
dynamic vit gradient_checkpointing
#2071 merged Sep 20, 2024
Support Mistral-small-inst-2409
#2077 merged Sep 20, 2024
fix RLHF & max_length
#2075 merged Sep 19, 2024
Update qwen2-vl最佳实践.md
#2058 merged Sep 19, 2024
fix rlhf zero3
#2072 merged Sep 19, 2024
Fix yi template
#2067 merged Sep 19, 2024
fix win32 quote
#2065 merged Sep 18, 2024
update qwen2-vl docs
#2063 merged Sep 18, 2024
fix notebook gradio
#2062 merged Sep 18, 2024
support qwen2.5-coder
#2061 merged Sep 18, 2024
vllm support mutli image
#2059 merged Sep 18, 2024
support qwen2-vl -72b/qwen2.5-math/qwen2.5-coder
#2056 merged Sep 18, 2024
Support qwen2.5
#2054 merged Sep 18, 2024
support qwen2-vl-base
#2052 merged Sep 18, 2024
fix qwen2vl position_ids
#2051 merged Sep 18, 2024
update docs
#2050 merged Sep 17, 2024
llama3 tool calling
#2048 merged Sep 15, 2024
Fix multi coordinate grounding
#2047 merged Sep 15, 2024
support multi bbox grounding
#2045 merged Sep 15, 2024
fix mplug-owl3
#2042 merged Sep 14, 2024
Add longwriter filtered dataset
#2037 merged Sep 14, 2024
fix rlhf & zero3
#2034 merged Sep 14, 2024
Fix olora and pissa saving files which will cause the second saving failed
#2032 merged Sep 13, 2024
fix deploy eval kill
#2029 merged Sep 12, 2024
update code
#2028 merged Sep 12, 2024
refactor rlhf
#1975 merged Sep 12, 2024
Florence use _post_encode & template support encoder-decoder
#2019 merged Sep 11, 2024
Add FAQ Document
#2013 merged Sep 11, 2024
fix lmdeploy qwen_vl
#2009 merged Sep 11, 2024
Support llava1.6-llama3.1-8b-instruct
#2005 merged Sep 10, 2024
Fix rlhf ref model
#2003 merged Sep 10, 2024
compat lmdeploy==0.6
#2001 merged Sep 10, 2024
fix EngineGenerationConfig importError of lmdeploy
#1990 merged Sep 10, 2024
Support Deepseek 2.5
#1992 merged Sep 10, 2024
fix
#1995 merged Sep 10, 2024
fix patch
#1997 merged Sep 10, 2024
fix model_mapping
#1982 merged Sep 9, 2024
fix typo
#1980 merged Sep 9, 2024
Add reflection model
#1973 merged Sep 7, 2024
update docs
#1970 merged Sep 7, 2024
support mplug_owl3
#1957 merged Sep 7, 2024
fix bugs
#1959 merged Sep 6, 2024
Fix the lora hook
#1963 merged Sep 6, 2024
Fix data info print in rlhf
#1964 merged Sep 6, 2024
Add lazy_tokenize to RLHF
#1956 merged Sep 6, 2024
Support minicpm 3
#1952 merged Sep 5, 2024
fix rlhf
#1949 merged Sep 5, 2024
support dynamic_eos
#1947 merged Sep 5, 2024
fix qwen2-vl & video
#1950 merged Sep 5, 2024
fix file rename error in megatron when there are multi process
#1948 merged Sep 5, 2024
refactor rlhf
#1885 merged Sep 5, 2024
fix do_sample
#1946 merged Sep 5, 2024
fix lmdeploy seed
#1945 merged Sep 5, 2024
update yi-coder
#1942 merged Sep 5, 2024
fix swift deploy
#1936 merged Sep 4, 2024
fix typing
#1933 merged Sep 4, 2024
Support deploy & logprobs
#1833 merged Sep 4, 2024
[TorchAcc] fix: fix the judegement of fsdp_num
#1903 merged Sep 4, 2024
update docs & fix bug
#1926 merged Sep 4, 2024
update wechat
#1925 merged Sep 3, 2024
[TorchAcc] perf: use xm.save instead of torch.save
#1916 merged Sep 3, 2024
refactor docs
#1915 merged Sep 3, 2024
Refactor docs
#1912 merged Sep 3, 2024
fix web-ui push to hub strategy
#1909 merged Sep 3, 2024
update docs
#1908 merged Sep 3, 2024
deepspeed use cosine lr_schduler
#1907 merged Sep 2, 2024
support logprobs
#1900 merged Sep 2, 2024
fix push_to_ms
#1901 merged Sep 2, 2024
support custom quantized dataset
#1893 merged Sep 2, 2024
Fix push_to_hub when last-checkpoint
#1897 merged Sep 2, 2024
Add some warnings and fix RLHF
#1890 merged Sep 2, 2024
add vllm lmdeploy benchmark
#1889 merged Sep 2, 2024
Fix push to hub logic
#1888 merged Sep 2, 2024
Refactor push_to_hub
#1883 merged Sep 2, 2024
support qwen2-vl gptq awq
#1884 merged Sep 2, 2024
Support freeze vit
#1880 merged Aug 31, 2024
use model.generation_config
#1850 merged Aug 31, 2024
add duet
#1877 merged Aug 31, 2024
Fix neftune doc
#1875 merged Aug 31, 2024
Fix num_proc
#1874 merged Aug 30, 2024
Add train record
#1873 merged Aug 30, 2024
[TorchAcc] fix serveral bugs for torchacc FSDP.
#1872 merged Aug 30, 2024
Support faster data map
#1871 merged Aug 30, 2024
update docs qwen2-vl
#1869 merged Aug 30, 2024
fix requirements
#1864 merged Aug 30, 2024
fix qwen2-vl docs
#1861 merged Aug 30, 2024
update qwen2-vl docs
#1858 merged Aug 29, 2024
update qwen2-vl docs
#1856 merged Aug 29, 2024
Update new datasets
#1855 merged Aug 29, 2024
support qwen2-vl & video finetune
#1849 merged Aug 29, 2024
Support qwen2 vl grounding
#1854 merged Aug 29, 2024
Fix Pissa and OLoRA
#1852 merged Aug 29, 2024
Fix some datasets for streaming
#1848 merged Aug 29, 2024
Add internvl2 awq models
#1846 merged Aug 29, 2024
support qwen2-vl
#1842 merged Aug 29, 2024
Support eval_nproc
#1843 merged Aug 29, 2024
fix internlm-xcomposer rlhf
#1838 merged Aug 28, 2024
add ddp_timeout parameter
#1836 merged Aug 27, 2024
support qwen2-pro dataset
#1834 merged Aug 27, 2024
fix inject
#1835 merged Aug 27, 2024
Fix code
#1824 merged Aug 27, 2024
fix minicpm-v 2.6 infer device_map
#1832 merged Aug 27, 2024
use default-lora
#1823 merged Aug 27, 2024
Support register loss func
#1822 merged Aug 26, 2024
fix dora deployment
#1821 merged Aug 26, 2024
Support liger
#1819 merged Aug 26, 2024
fix preprocess_num_proc
#1818 merged Aug 26, 2024
fix mp+ddp & resume_from_checkpoint
#1815 merged Aug 26, 2024
Support zero2 offload
#1814 merged Aug 26, 2024
compat with vllm==0.5.5
#1812 merged Aug 25, 2024
fix
#1811 merged Aug 23, 2024
fix offline export
#1805 merged Aug 23, 2024
Support Latex OCR dataset
#1810 merged Aug 23, 2024
Support hd num
#1801 merged Aug 23, 2024
fix megatron_patch_path
#1804 merged Aug 23, 2024
fix CI
#1797 merged Aug 23, 2024
fix mllm rlhf with full sft type
#1800 merged Aug 22, 2024
fix history_roles
#1798 merged Aug 22, 2024
fix imports
#1796 merged Aug 22, 2024
fix bugs
#1794 merged Aug 22, 2024
fix yi-vl template
#1793 merged Aug 22, 2024
support qwen-vl & base64
#1790 merged Aug 22, 2024
update doc
#1789 merged Aug 22, 2024
ReFT
#1785 merged Aug 21, 2024
support phi3.5-vision
#1780 merged Aug 21, 2024
fix moe & gradient_checkpointing
#1782 merged Aug 21, 2024
fix infer dataset_test_ratio
#1779 merged Aug 21, 2024
Fix zero3 & minicpm-v/internvl2/xcomposer
#1772 merged Aug 20, 2024

Sometimes conversations happen on old items that aren’t yet closed. Here is a list of all the Issues and Pull Requests with unresolved conversations.

书生26B合并dpo后的适配器失败
#1667 commented on Aug 23, 2024 • 0 new comments
能否支持/v1/embeddings的api调用
#807 commented on Aug 27, 2024 • 0 new comments
export problem: get_model_tokenizer_with_flash_attn() got multiple values for keyword argument 'automodel_class'
#836 commented on Aug 28, 2024 • 0 new comments
2.0.4之后的版本的显存使用问题
#922 commented on Aug 28, 2024 • 0 new comments
是否支持自定义lr_scheduler
#1075 commented on Aug 28, 2024 • 0 new comments
Loss and acc drop to 0 after several steps
#1062 commented on Aug 28, 2024 • 0 new comments
可以支持一下InternLM2-Math-Plus-Mixtral8x22B的微调吗
#1019 commented on Aug 28, 2024 • 0 new comments
希望能应用TensorRT加速训练和推理
#942 commented on Aug 28, 2024 • 0 new comments
Process hang with futex(0x7f403c0199d0, FUTEX_WAIT, 14826, NULL
#1128 commented on Aug 28, 2024 • 0 new comments
minicpm-v-v2_5-chat 微调vpm显存溢出
#1286 commented on Aug 28, 2024 • 0 new comments
自定义评测数据集做评测时出现，模型用vllm.entrypoints.openai.api_server起的。运行评测脚本出现错误
#1295 commented on Aug 28, 2024 • 0 new comments
关于agent微调数据问题
#1351 commented on Aug 28, 2024 • 0 new comments
Representing results of Agent best practice with Qwen2-7b-instruct outputs unexpected <|endoftext|> and <|im_start|>
#1155 commented on Aug 28, 2024 • 0 new comments
Florence2 batched inference
#1441 commented on Aug 28, 2024 • 0 new comments
能否加上昇腾NPU上多卡推理
#1469 commented on Aug 28, 2024 • 0 new comments
smooth quant support
#1489 commented on Aug 28, 2024 • 0 new comments
RAG支持
#1548 commented on Aug 28, 2024 • 0 new comments
可以在moe的模型训练中增加专家并行的参数吗
#1631 commented on Aug 28, 2024 • 0 new comments
是否考虑支持RLHV-V中提出的DDPO
#1639 commented on Aug 28, 2024 • 0 new comments
support llama3 megatron
#1736 commented on Aug 28, 2024 • 0 new comments
单机三卡微调50K数据OOM
#1729 commented on Aug 30, 2024 • 0 new comments
swift 量化多模态大模型internvl2-26B，报错
#1504 commented on Aug 31, 2024 • 0 new comments
魔搭NPU训练部署交流群
#1589 commented on Sep 4, 2024 • 0 new comments
AttributeError: module 'transformers_modules.InternVL2-2B-1epoch.tokenization_internlm2' has no attribute 'InternLM2Tokenizer'
#1663 commented on Sep 8, 2024 • 0 new comments
SWIFT 2.4 TO DO LIST
#1617 commented on Sep 10, 2024 • 0 new comments
Best practice for Qwen2-Audio
#1653 commented on Sep 11, 2024 • 0 new comments
Best Practices for Inference and Fine-Tuning with MiniCPM-V 2.6
#1613 commented on Sep 15, 2024 • 0 new comments
DPO训练的时候grad_norm出现nan值
#923 commented on Sep 17, 2024 • 0 new comments

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

August 20, 2024 – September 20, 2024

Insights: modelscope/ms-swift

August 20, 2024 – September 20, 2024

Overview

Could not load contribution data

4 Releases published by 1 person

129 Pull requests merged by 11 people

4 Pull requests opened by 4 people

283 Issues closed by 30 people

80 Issues opened by 66 people

28 Unresolved conversations