Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
GentorX
Цена вещи обратно пропорциональна желанию продавца с ней расстаться!
-----
Клуб Vinyl Breath:
viewtopic.php?f=20&t=35506
Продажа винила:
viewtopic.php?f=28&t=36980
-----
-----
Клуб Vinyl Breath:
viewtopic.php?f=20&t=35506
Продажа винила:
viewtopic.php?f=28&t=36980
-----
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
теперь это объясняет боттлнек при записи в видеопамять (и не только, на самом деле), а я думал что дело в чипсете . Кстати, это же и объясняет, почему советуют перед последовательной записью большого блока в память вначале сделать холостое чтение в начале кеш-строки, чтобы потом она записалась уже в пакетном цикле с максимальной скоростью:
Код: Выделить всё
вместо:
mov [edi+0], eax
mov [edi+4], ebx
mov [edi+8], eax
mov [edi+12], ebx
...
mov [edi+24], eax
mov [edi+28], ebx
надо вначале сделать, например:
mov cl, [edi]
затем уже запись:
mov [edi+0], eax
mov [edi+4], ebx
mov [edi+8], eax
...
здесь edi выровнен на границу 32 байта
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
Да, если процессор без ммх,то это будет лучшим вариантом. Однако если есть ммх то не факт. Холостое чтение строки само по себе - примерно 7-9 тактов шины (в лучшем случае) + 7-8 на запись обратно. Выкидывание 4х слов ммх - это 4*3 = 12 тактов. Если же это видеопамять, то чтение из нее может быть на порядок ()в 10 раз) медленнее записи и тут такой трюк не пройдет. Собсно поэтому процессоры ммх и стали любимы, т.к. они давали легкое ускорение мемсру, а не из-за каких-то там мультимедий.wbcbz7 писал(а): ↑07.02.2021,18:15теперь это объясняет боттлнек при записи в видеопамять (и не только, на самом деле), а я думал что дело в чипсете . Кстати, это же и объясняет, почему советуют перед последовательной записью большого блока в память вначале сделать холостое чтение в начале кеш-строки, чтобы потом она записалась уже в пакетном цикле с максимальной скоростью:Код: Выделить всё
вместо: mov [edi+0], eax mov [edi+4], ebx mov [edi+8], eax mov [edi+12], ebx ... mov [edi+24], eax mov [edi+28], ebx надо вначале сделать, например: mov cl, [edi] затем уже запись: mov [edi+0], eax mov [edi+4], ebx mov [edi+8], eax ... здесь edi выровнен на границу 32 байта
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
так-то и на пнях можно было писать сразу по 64 бита через FPU, правда получалось не настолько быстрее а с MMX memcpy я и сам баловался - действительно выходил нехилый буст (правда на PII обычный rep movsd уже был практически на равных)
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
FPU при загрузке/выгрузке операндов проверяет и модифицирует их если надо. Использовать его для копирования произвольных данных нельзя, имно. Или это можно отключить как-то?
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
можно копировать через FILD qword ptr/FISTP qword ptr, точности 80бит float вполне хватает. FLD/FSTP работать не будет, тормозя и портя денормалы/NaN
- Takedasun
- Advanced Member
- Сообщения: 3640
- Зарегистрирован: 16.10.2013,18:07
- Откуда: Керчь
-
Вклад в сообщество
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
В продолжении темы viewtopic.php?p=288013#p288013 настройки системы MVP3 на максимальную производительность.
Как оказалось, если после всех оптимизаций заменить одностороннюю планку памяти 128МБ (с которой изначально настраивались система на максимальную производительность), например, на две планки по 64МБ или на одну двухстороннюю планку 128МБ, то Windows, тупо, не загружается
Как оказалось, если после всех оптимизаций заменить одностороннюю планку памяти 128МБ (с которой изначально настраивались система на максимальную производительность), например, на две планки по 64МБ или на одну двухстороннюю планку 128МБ, то Windows, тупо, не загружается
- Rio444
- Почётный пользователь
- Сообщения: 26861
- Зарегистрирован: 14.09.2014,19:11
- Откуда: Ростов-на-Дону
-
Вклад в сообщество
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
Видимо буфера не держат такое количество чипов. Или увеличивать тайминги (возможно хватит и одного, методом перебора), либо возвращать назад одностороннюю 128Мб.
Были ещё 64Мб по 4 чипа.
P.S. Хотя всё может быть гораздо банальнее - почистить ластиком контакты модуля.
Электронка: копия
- Takedasun
- Advanced Member
- Сообщения: 3640
- Зарегистрирован: 16.10.2013,18:07
- Откуда: Керчь
-
Вклад в сообщество
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
Позже выяснилось, если не включать параметр DRAM Start Cycle (With cache 66 Mhz) Device 0 Offset 6C, то работают любые планки.Rio444 писал(а): ↑26.07.2021,10:52Видимо буфера не держат такое количество чипов. Или увеличивать тайминги (возможно хватит и одного, методом перебора), либо возвращать назад одностороннюю 128Мб.
Были ещё 64Мб по 4 чипа.
P.S. Хотя всё может быть гораздо банальнее - почистить ластиком контакты модуля.
- Takedasun
- Advanced Member
- Сообщения: 3640
- Зарегистрирован: 16.10.2013,18:07
- Откуда: Керчь
-
Вклад в сообщество
Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
Только сейчас обратил внимание на низкую скорость работы L2 кэша. На плате ASKA SST-5811 он работает медленнее, чем на ALI Aladdin V и FIC VA-503+
Вроде как все настройки работы L2 кэша выкручены на максимальную скорость Лучший чипсет для AMD K6-2 (Небольшое тестирование, неожиданные результаты..)
BIOS от VA503+ на 5AGM2 показал, что разница в этом:
Device 0 Offset 51 - Cache Control 2
bit 3 SRAM banks
0 - 1 bank (VA503+)
1 - 2 banks (5AGM2)
Device 0 Offset 51 - Cache Control 2
bit 3 SRAM banks
0 - 1 bank (VA503+)
1 - 2 banks (5AGM2)